腾讯篮球比赛视频 脑力劳动和体力劳动的区别真的准确吗?反思传统标准
发布时间:2024年05月29日 18:58
我们一般认为,坐在办公室的人应该是脑力劳动者,也就是工作中基本不用头部和手指以外肌肉的人。在高度重视教育的东亚,这种区分进一步二元化,认为体力劳动只是简单、重复、枯燥的肌肉循环,只有脑力劳动才是充满挑战、变化、不可预测的高智慧人类劳动。
这种区分和背后的含义真的准确吗?比如橄榄球运动员,体格健壮如牛,气喘吁吁地奔跑、冲撞,甚至摔跤。但橄榄球是一项非常注重规则和战术、严格依赖团队合作、考验个人即时判断的运动。这些壮汉干活的时候难道不用脑子吗?
再比如在田间辛勤劳作的农民和工厂里的焊工。他们不仅要掌握并不断磨练自己的技能,还要应对工作中的随机性,如气候变化和不规则的霉菌。他们不是阅读和写作方面的专家腾讯篮球比赛视频,但他们在工作领域拥有极高的技能和适应能力,而这些都需要心理判断。
更关键的问题,不是体力劳动者是否用脑,而是“脑力劳动白领”的工作是否真的富有挑战性、变化性、不可预测性,需要高水平的智慧与判断能力。
会计人员每天要花大量时间对比数据、整理表格;对于合格的写作人员来说,收集素材与产出内容的比例至少是二比一;教师、律师、医生等职业大多数时间没有太多时间去接触新事物,每天被迫应对重复性、浅显知识性的电话;至于客服、数据录入员、审计员等传统白领岗位,距离“脑力劳动”就更远了。
提出这个话题的目的,不是为了批判什么,而是为了揭示在人类劳动的现状中,即使是传统意义上的“脑力劳动”,也存在着太多重复、单调、枯燥的时刻。
这并非是让人类更快乐的工作模式,因为在这些工作中,人只是工具而已。他们和扳手、锤子、钉子没什么区别,只不过人比这些工具多学了十几年。比如近年来,不少公司都在做实时翻译器。看到手里这个鸡蛋大小的小玩意儿清晰地翻译多种语言,不少拥有专业八级学位的顶尖外语学生都感到心酸——这个工具不就是他们自己的物化版本吗?
从 21 亿秒中找出 60 秒
自获得NBA赛事网络转播权以来,腾讯视频库已经积累了69年来超过21亿秒的篮球比赛视频素材,这份丰富而庞大的视频素材储备,既是福也是祸。
这是一个常见的场景:在NBA比赛转播中,经常需要为某位球员制作精彩片段,比如当球员获奖、在比赛中表现出色、或者非常受欢迎的时候。我们在网上看到过很多这样的视频。
然而,有谁想过,制作这些视频的剪辑师们是怎么工作的?他们需要从几亿秒的视频中找到60秒可用的素材,然后根据自己的认知判断将其剪辑成完整的视频,最后加上音乐和特效才算完成。
从传统意义上来说,这项工作无疑是脑力劳动,但上述质疑也并非空穴来风:按照特定属性寻找视频素材,遍历庞大的数据库,将这些视频素材组合成一个逻辑清晰的视频时间轴。抽象起来,这些步骤不过是搜索、判断、剪辑的不断重复。这真是“智慧的结晶”吗?
因此,腾讯找到了一个帮手来分担这项单调重复的工作——IBM AI Brain。(以下简称IBM Brain)
IBM 视觉大脑的工作原理并不复杂,它只是模拟了普通人类编辑所要做的工作。
首先,腾讯体育编辑会根据需求给IBM视觉大脑分配任务,比如“寻找凯文杜兰特的精彩瞬间”,其中包括投篮、扣篮、抢断、盖帽等内容。
接下来,IBM Brain 会对视频素材的每一帧进行多通道分析并标注,包括人物、运动轨迹、声音等,将非结构化的视频数据提炼为结构化数据,并利用数据库进行实时管理,使得每一帧都可搜索。同时腾讯篮球比赛视频,还会根据动作的精彩程度、不同主题的契合度等生成综合评价。
最后,根据体育编辑设定的主题和选手要求,“AI剪辑师”根据综合评分选取最相关的视频片段,近乎实时地自动生成一分钟剪辑好的视频,并添加特效。这一系列操作对于IBM Brain来说只需要20秒。
这是什么意思?
看足球没那么简单
由于在座的各位大多是成年人,因此我必须请你们回忆一下童年时第一次在电视上看到乒乓球比赛的情景。当时我唯一的感觉就是“我不知道球在哪儿”。我的眼睛和脖子跟不上球来回弹动的速度。过了一会儿,我就失去了兴趣,换了频道。
(中国乒乓球运动员:马龙)
篮球是一项高速运动,视频分析是所有运动中最难的。场上十个身材高大的男人经常在狭小的空间内重叠、碰撞、跳跃、变向,动作迅速,很难识别。比赛规则也极其复杂:踩线、盖帽、干扰球、撞击对手、有效防守……都在一条细线上。更何况球出手后还有多种可能性:传球、投篮、三分球,甚至非常花哨的上篮。
正如我所说,人类常常低估自己已有的能力。为什么不尝试与从未见过篮球的新朋友谈论篮球,感受一下那种崩溃的感觉呢。
为了让AI理解球,IBM采用了“多模态视觉理解技术”。比如,如何判断正在漂移投三分的球员是库里?这涉及到机器视觉(判断库里的脸、球衣等)、动作识别(库里的投篮、运球、上篮、防守等)、声音识别(库里进球后的怒吼、被吹犯规后的抱怨等)等多项技术。同样,通过对各种游戏元素的训练,机器可以理解什么是进球、进攻方是谁腾讯篮球比赛视频,并根据不同的投篮姿势判断投篮方式(三分、后仰、上篮、扣篮等)。
在理解了比赛内容之后,IBM Brain 会用自己的逻辑对海量的视频进行分类:比如哪些场景定义为扣篮,哪些场景是后仰跳投,哪些是盖帽等等。贴上标签之后,你就可以搜索到任何你想要的素材。有趣的是,IBM Brain 还能对动作进行评分。比如,某位球员的扣篮很有表现力,可以得到满分;而另一位球员勉强把球投进篮筐,只能得到及格分数。这种评分机制是快速生成“精彩片段”的关键。
这些看似简单的步骤,是AI技术飞速发展的结果。人类一直以来都具备快速理解复杂模糊局面的能力,而这一能力基本被AI“偷”走了——要知道,这套系统可以瞬间把长达数小时的篮球比赛,按照“聪明”、“霸气”、“精准”、“强悍”等标准,划分成不同的片段。
由此带来的效率提升是显而易见的,剪辑师们再也不用因为赶时间而把某一个素材用光了,另外数据的快速处理还能让他们从海量的视频资源中挖掘出金矿,让历史视频素材得到最大价值的利用。
统计数据显示,在海量的存储视频中,只有20%的数据能够被用户频繁访问,因此在数据爆炸的时代,许多视频运营商致力于有效激活另外80%的非活跃数据。到2025年,全球数据量将达到163ZB,人类已经不可能处理这个天文数字,而这正是IBM的视觉大脑发挥作用的地方。
让工具回归工具,把人当人
不难看出,对于视频编辑人员来说,IBM Brain 能够提供最符合制作需求的视频片段。当寻找合适素材这一耗时的过程得到完美解决时,编辑人员的工作任务也被分解,从而腾出更多时间来开发更具创意的视频内容。
只有那些真正具有创造性、需要人类作为智能生物发挥无限创造力的工作,才真正配得上“脑力劳动”。比如,让IBM的视觉大脑去拍李安的电影,根本就不可能。另一方面,那些能被IBM的视觉大脑取代的工作,恐怕也太尴尬了,不配称为“脑力劳动”。比如,各类视频的粗剪、产品质检、安防监控,其实都不需要人来监督,还不如用AI来做,成本更低,效率更高。
总之,人工智能技术的进步,不是抢走人的工作,而是代替人去做重复、单调、低级的工作,解放人,让工具回归工具,把人当人,从而提高整个社会的效率和幸福感。
IBM 视觉大脑无疑是人类智慧实践的成果之一,然而,再强大的它,也只是当前人工智能领域众多探索轨迹之一,像这样有趣的故事,在地球上随时都在发生。
近日,探索频道推出了一部名为《这就是人工智能》的纪录片。在这部由十章组成的人工智能全景纪录片中,IBM Brain 代表了第八章“人工智能第六感”的技术路线——由于人工智能具有识别人脸、理解语言和分析动态视频的能力,许多国家的安全部门已经将人工智能作为助手,识别潜在的犯罪活动。
这是目前为止我看过的关于AI最清晰、最易懂、最真实的一部纪录片。这里没有牵强附会的推测,也没有过于宏大的讨论,只有真实的案例、问题和实践。你可以看到人类如何利用AI攻克一个个技术难关,如何在与AI共存的同时探索新的分布结构和认知体系,就像一部“技术创世记”。
这十个逻辑自成体系的章节,从“理解人类语言”开始,到“与机器争论”,再探讨“机器如何学习”,最后“与机器融为一体”。无论你是普通的技术从业者、媒体人、学生,甚至只是路人,都值得一看。因为这部纪录片讲述的内容,囊括了人类改变自身命运的最新实践和未来可能性,更何况连中学生都能看懂。
接下来的一个半小时,你可以找个舒服的地方静静地享受思考和认知的乐趣。如果你时间不够,也没关系,把这篇文章存起来,每天花几分钟看一看。吃饭时吃点东西也不错。