当前位置: 首页 -  必威官网 - 正文

分享人工智能与媒体服务的契合以及未来的发展方向

2019-12-13 15:49 必威官网 左秋155°c
A+ A-

除了传统服务,微软还提供了五大方面29类的认知服务,而这29类服务又分别都提供了自己相关的API,它不仅可以用在传统的图片、语音识别、知识搜索,你可以非常方便地将它应用到自己的媒体服务中。特别的,我们还有一个最新的服务Video Indexer,我们前面提到的10种人工智能服务都包含其中,包括translater——无论文字或者语言的,这样对于一个视频,它就会自动根据你的需求去进行说语音识别、人脸识别、字幕翻译、多语言翻译、视频内容总结、场景分析等等。那如果你希望视频有更多的拓展,比如知识搜索就非常重要,你可以根据视频去搜索相关的视频、图片,同样的你还可以进行新闻的搜寻。

人工智能为多媒体服务带来了更多、更有价值的新功能,让你的媒体、你的video更加智能化,帮助用户获取更好的体验。微软大中华区创新技术合作事业部 (CSE)资深技术顾问梁建为我们分享了人工智能与媒体服务的契合以及未来的发展方向。

人工智能让媒体服务更“聪明”

分享人工智能与媒体服务的契合以及未来的发展方向

这里我们还提供了Custom Services——从视觉、到语言理解、到语音服务、到搜索都有一个定制化的体验。其实我们的API都是通用的,只不过定制化的场景、训练的数据是需要大家来提供。比如你希望在视频服务中为用户做更多的拓展搜索,但又并不希望进行全网搜索找到一些不想要的信息,那么此时你就可以利用Custom Search定义相关的网站和希望的内容,从而得到你规定的信息。语言理解上,大家可以很方便地把一些用户在视频聊天对话中,给他的关键词、用户所要的意图、定义一些场景,通过自然语义理解抽取出来。包括我们说的Custom Vision可以通过frame这种方式把视频中的一些场景、物体识别、场景给他抽取出来,让我们的视频不仅仅是传统中的观看、编码、streaming,同样的你也可以通过人工智能拿到更多的信息。  

大家可以思考下在哪些场景上人工智能技术能帮助我们实现更多的场景?比如如何在越来越多的视频中发现更好的、更需要的内容;如何让视频内容里人物之间产生关系;在视频编辑和处理过程中,如何增加字幕的信息以及多语言的支持;如何让视频自动的增加评论,像大家熟知的视频里中比较流行的弹幕;以及如何让视频里产生更多的价值,比如在视频里如何更好的嵌入广告,让视频自动的把对用户的洞察力、想法展现出来。  

2017年,我们经历了整个媒体行业视频服务、视频处理的快速发展,与此同时人工智能和区块链也是去年的热点话题,那我们就一起来看下人工智能和我们的媒体服务如何进行结合。  

大家好,我是来自微软创新技术合作事业部的梁建,很高兴接受LiveVideoStack的邀请,跟大家一同介绍和畅想媒体服务video在未来2018年可能的发展。