手机上、电视中,视频可以说无处不在。在当代快节奏的生活中,人们很少有机会从文字中汲取所需的信息,取而代之的,便是单位时间内信息量更大也更具通感的视频了。而伴随着5G与AI的来临,视联网这个概念应运而生。
作为互联网的升级版本,视联网其实早已在我们的生活中扎根生长。通过“预期-推送”的机制,视联网的早期参与者们目前已经开发出了广告和电商两类应用模式。比如说国内的极链科技,通过解析视频内容中蕴含的人物、物体、动作、地标等各类信息,可以寻找到与广告品牌内涵相一致的视频场景,进而实现广告的精准投放。这也是视联网在商业领域的初步试探。
要知道,目前的视联网尚且还处于婴儿期,主要模式是“预期-推送”的提前规划。在这一模式中,本质上是利用外部已有的用户行为大数据(抑或是常识)对观看用户的心态和行为进行预判,进而在计算机解析出的场景信息中挑选出那些被认为是最能引起观众共鸣的场景,推送与之相关的应用服务。
而当视联网一步步发展,最终迈入成熟期时,其模式也将发生相应的变化。在这一阶段中,“实时”与“调用”将是描述应用模式最为核心的关键词,与婴儿期的“预期-推送”模式形成鲜明的对比。当然,这并不意味着“预期-推送”模式被取代,更可能是作为“实时-调用”模式的一种补充。
“实时”强调的是视频解析能力的全面性和即时性。这一时期的视频内容将在各个维度被全面解析,人眼观察所能认知的一切信息都将被计算机捕获,甚至超越人眼的可辨识范畴的信息都将被计算机掌握。并且,这种识别能力将是极为迅速的,视觉所及的一切内容在形成需求前都将被计算机解析,从而响应人们随时可能激发的任意需求。
“调用”强调的则是互联网服务与视频内容的完美结合,包含了互联网服务的全面链接和互动形式的因地制宜两重含义,是视联网生态成熟的重要标志。在这一时期,互联网中的各类服务和应用将与视频内容全方位打通,人们在观影过程中激发出的需求将可以十分便利的调用对应的互联网服务来满足。例如,对于景点不了解就调用百科功能,对于商品感兴趣就调用电商功能。同时,不同形式的互联网服务将以最恰当的互动形式呈现给人们,实现体验的最优化。
在这种情况下,视频的信息量将不再局限于视频本身。这就需要一个完整的视频互动生态来进行约束。而要形成一个完善的视频互动生态,最为重要的就是建立一个针对视频互动技术的开发者生态,让开发者有动力和激励围绕视频识别技术的进步不断研发新服务和更新已有的互动程序。此外,视频互动生态是建立视频识别能力之上的。如何最大化利用既有的视频识别能力,链接尽可能多且好的互联网服务、为视频观众提供最为便利性的服务,是视频互动生态建设的核心问题。
视联网的成熟期可能在未来的10-15年内到来,这主要取决于新一代智能设备的成熟时间。届时,智能硬件与视联网将完美结合,人的视觉感官将成为互联网的入口,可以链接到一切连入互联网的设备并享受其提供的服务。到时,幻想中的科技将不再是幻想,人类必将迎来一个崭新的视界。