北京中科模识科技有限公司(模识科技、Pattek),专业从事海量音视频内容处理技术和产品开发的创新型企业。作为音视频内容智能处理的行业先锋,模识科技一直不懈探索,努力实践,已率先在国内广播电视内容检测和基于内容的音视频检索方面建立了规模化示范应用项目,并获得广电总局和中国新闻技联科技进步奖。
就在最近,模识科技凭借近年成功应用工程项目经验,推出了两款面向海量广播电视内容监测和管理的产品:广播电视内容智能检测系统(Pattek CMS v.2.0)和Pattek语音检索系统(Pattek SIR v.1.5)。可广泛应用于广播电视内容采集、制作、编目、管理、发布、服务单位和各级广播电视监测单位。
相对于目前广播电视数字媒体内容管理和监测行业,上述两款产品的推出具有行业技术升级意义。模识科技在音视频数字内容管理这条道路上的发展历程如何?这两款产品究竟具有什么样的功能和特点?带着这些问题,本期商询记者特意采访了北京中科模识科技有限公司负责广电行业市场推广的丁鹏博士,且让我们听听他畅谈音视频数字内容管理的现状与未来······
检索适合我国广电内容管理产品发展模式
伴随着我国广播电视事业的蓬勃发展,近年来新业务的迅速开展对检测内容的规模、多样性、管理能力以及监测工作的时效性都提出了更高的要求,而现行主要依靠人工的内容监测与管理方式已经无法适应上述发展。从2005年开始,在充分交流业务模式和快速定制基础上,模识科技首先将其独到的语音综合处理技术应用于广电总局监测中心。该系统目前日处理数据量达到T级,在明显提高监测效果的同时,极大的降低了工作强度,得到了有关部门领导的充分重视与肯定。在此基础上,模识科技今年更是推出了面向各级广电监测部门的通用产品广播电视内容智能监测系统(Pattek CMS v.2.0)。
“根据我们对检测业务的凝练,Pattek CMS系统主要集成了三个功能,节目搜索主要是从历史节目库中通过固定的节目片头曲或其他音频模板,可以帮助用户从海量广播电视数据中找到关心的节目,事实上这个技术我们也成功应用到了工商管理部门的广告监测中”,丁鹏介绍说,“特定节目发现功能可以对广播电视节目进行实时监测,通过对某些特定词语的检出,进而分析和发现用户关心的节目内容,并自动内容聚集。就拿最近的抗洪救灾举例说,用户关心整个事情的发展,我们的系统就可以自动地找到各地广播电视台对这件事情的跟踪报道,自动拆条提交用户。用户如果希望把这些报道转成文字报告,就可以使用系统提供的第三个功能生成舆情分析来完成”。
随着模识科技在广电内容管理领域的不断深入,模识科技开始将音视频智能处理技术与媒体资产管理需求结合。随着各级广播电视制作发布单位以及互联网音视频社区中各类数字音视频内容的迅速膨胀,目前基于简单元数据标签(tag)以及粗放分级编目的手工信息索引方式,不仅费人费时、容易出错,且日益无法满足使用者精确、复杂和个性化检索的需求。Pattek SIR1.5正是看准了这一需求以及结合点而设计。
对于广播电视语音检索系统,丁鹏谈到:“Pattek SIR从形式上很想谷歌百度等网络搜索引擎,所不同的是它所索引的对象市广播电视节目。用户可以以文字形式输入查询库中的广播电视节目,这样一来广播电视内容编目和管理就可以更加简单和个性化了。”
对于广播电视内容管理产品,丁鹏认为除了音视频处理技术外,最大的挑战莫过于数据的海量性和多样性。每天音视频数据数以万计地不断增长,且数据格式多样、语言不同。对这样的数据进行处理不同于实验室的研究课题,具有极大的挑战性。模识科技的研发人员也为此付出了巨大的努力:他们先后开发出了适合互联网计算机环境和适合局域网计算机环境的面向广播电视媒体数据处理的并行计算环境,并提出了相应的多语言处理技术路线。
用户至上 大有可为
模识科技在广播电视内容检测与管理领域的探索较早,起步较早,通过几年的摸爬滚打,逐步深入的探索符合中国广电监测和媒体资源管理服务的需求,并且积极的投入在相关的技术研究、系统开发、产品定位和服务方式上的工作,应该说在实践方面相对成熟。
尽管如此,面对上述科研、应用和产业化成果,丁鹏还是感到自己肩上的担子很重。他说,“计算机音视频内容管理技术在广电监测和媒资管理方面的相互结合才刚刚进入起步阶段,应用需求挖掘的越深,越觉得可做的事情很多。如何在产品中体现技术与应用的完美结合,都是我们一直在思考和实践的内容。在未来,随着科技的不断发展和深入,我们产品将会不断升级,模识科技也将形成自己的独到风格和品牌,这一切都是为了给用户提供更好的服务。