解决方案

基于视音频智能处理技术的广播电视内容综合监测系统

发布日期:2014-04-24 13:33:45  来源:  作者:admin  浏览次数:0

    1.导论
    随着我国广播电视事业的蓬勃发展,尤其是数字高清电视的整体有序推进,广播电视监测业务类型已经从简单异态监测延伸到对节目内容的监测,而且内容监测的需求越来越广泛、越来越深入。总体来说,广播电视内容监测主要集中在以下四个方面:频道节目监测、新闻内容监测、新闻专题监测和广告监测,其面向的业务需求分别如下:
    1)频道节目监测:广播电视节目在实际播出时,会出现与预先制定的节目单不符,比较严重时会出现错播、漏播、插播等情况,此外还存在某一类型节目(如广告类、影视类)大量播放导致节目类型比例失衡的情况,及时发现和反馈这些问题越来越成为广播电视监测单位的重要业务。
    2)新闻内容监测:新闻节目是各类信息要闻的重要来源,如何从新闻节目中准确及时地得到新闻标题概览或新闻要点简报,或者检索到相关的新闻内容,从而为各级政府部门提供问题解决和决策支持赢得主动权,越来越作为各级政府广播电视管理部门、宣传部门的重要业务。
    3)新闻专题监测:对各类社会事件相关新闻专题信息的监测和分析,对于各级政府管理和宣传部门及时掌握该社会事件的发展变化和民众对该事件持有的态度,从而做到快速反应非常有意义。此外,随着境外落地节目的不断增加,及时监测和发现其中影响社会稳定或危害国家安全的专题信息也至关重要。
    4)广告监测:2009年9月,国家广电总局颁发了《广播电视广告播放管理办法》(简称61号令),规范了各类广告的播放原则,对广播电视台广告的播出做出了严格的规定,同时也对广播电视监测单位的广告监测工作提出了更高的要求。
上述业务的迅速开展对监测内容的规模、多样性、管理能力以及监测工作的实效性都提出了更高的要求,而现行主要依靠人工的内容监测与管理方式,使得各级广播电视监测管理部门在人力配置上明显感到力不从心,为此迫切希望采用一套行之有效的技术手段作为保障,以减轻人工的工作强度。
    当前音频分类与切分技术、信息检索技术、连续语音识别技术、关键词检测技术、固定视音频指纹比对技术、字幕提取与识别技术等视音频智能处理技术都得到了长足的发展,很多新技术都达到了在限制条件下的应用水平,与人工相比,具有处理速度快、效率高、漏检率低等特点。可以说,视音频智能处理技术的引入将会为广播电视内容的有效利用和实时监测带来革命性的突破[1-7]。

    2.广播电视内容综合监测系统
    
    如图1所示,广播电视内容综合监测系统采用三层架构,自上到下分为表示层、服务层和数据层。
    表示层为Web客户端,负责向中间服务层提交任务和结果显示,提供人机交互界面。Web客户端用户访问站点,通过动态网页与中间服务层进行交互以及数据通信,其中包括提交增加,删除,查询,修改,管理等操作。
    服务层包括Web服务、视音频处理网格计算平台以及系统服务三个部分。Web服务负责和Web客户端的交互;视音频数据网格计算平台用于对海量视音频数据进行监测与处理,其包括各子系统相应的调度器以及计算节点,是系统的核心组成部分;系统服务主要是提供一些服务工具,用于后台服务的管理等。
    数据层主要由以下两个部分组成,一是数据库以及数据库访问的持久层服务,提供面向对象的,更稳定,更好的数据库访问服务。二是已有的视音频数据所存放的磁盘阵列,以及文件发布系统。
    2.1.系统主要功能模块
    广播电视内容综合监测系统主要包含新闻内容监测、新闻专题监测、频道栏目监测、广告监测和系统管理5个子系统,其中:
    1)新闻内容监测子系统主要针对新闻时段的节目进行监测,将连续的新闻节目拆分为新闻条目,生成新闻条目串播单,并把新闻音频和字幕内容识别成文字,然后基于一组文本关键词搜索,可快速找到所关心的视音频内容。
    2)新闻专题监测子系统主要针对新闻时段的节目,用一组关键词定义描述一个专题,对该专题事件进行实时监测,用户对系统监测到的专题视音频时段进行审核、入库下载后,经过分析总结形成事件报告后上报给上级主管部门。
    3)频道栏目监测子系统的主要任务是基于节目片花模板,智能化生成频道节目串播单,与预订的节目时刻表比对后,对错播、漏播、插播的节目进行报警,并统计分析各类节目的播出情况。
    4)广告监测子系统的主要任务是基于广告模板,自动监测已知模板广告的播出次数、时长和位置,此外具有新广告、滚动与挂角广告的自动检测与发现功能,并统计各类广告的播出情况,输出统计表打印上报。
    5)系统管理子系统主要是对用户与权限、频道、日志、异常报警和设备进行管理,以利于系统维护。
    各子系统具体包含的功能模块如下表1所示:
 

具体功能模块组成
广告监测
广告模板管理、结果编辑与审核、监测任务管理、统计分析
新闻内容监测
监测任务管理、结果编辑与审核、结果浏览与查询
新闻专题监测
专题库管理、监测任务管理、结果编辑与审核
频道栏目监测
节目时刻表管理、节目片花模板管理、监测任务管理、结果编辑与审核、统计分析
系统管理
用户管理、频道管理、设备管理、异常管理和日志管理


    2.2.系统特点与优势
    1)全新的内容监测模式,集浏览、检索、定制推送于一体,可对海量的广播电视节目进行新闻内容、新闻专题、频道节目和广告的监测和检索;
    2)监测结果准确,检索速度快,改变了过去完全依靠人工值守监听监看进行内容监测分析的工作模式,提高了监测的客观性、准确性和完整性;
    3)支持各种常见的视音频格式(mp3、wmv、wma、rm、avi、mp4、h264、asf等),并可根据用户要求进行扩展支持;
    4)具有数据错误自动检查和系统异常自动监控报警重启功能,保证了系统运行的稳定性和可靠性;
    5)强大的集群并行计算底层支撑平台,可充分利用计算资源,做到负载均衡,而且可灵活扩展,动态增减计算能力,数据处理能力强;
    6)应用了多项国内领先、世界一流的视音频智能处理技术,技术密集度和水平高;
    7)灵活的开发接口和配置,系统部署维护方便,模型自适应,满足多种环境的内容监测要求;
    2.3.系统采用的主要技术
    如前所述,广播电视内容综合监测系统的核心组成部分是视音频数据网格计算平台,该平台使用了业界标准的网格计算框架,封装集成了若干当前比较成熟的视音频智能处理计算引擎,用于对海量视音频广播电视数据进行监测与处理[8]。
     视音频数据网格计算平台的架构如下图2所示:

    该平台基于标准接口,具有良好的扩展性,可根据监测业务的扩展,封装挂载相应的视音频计算节点。表2列出了该平台所采用的主要视音频智能处理技术,并介绍了这些技术的主要用途。
    表2 广播电视内容综合监测系统所采用的视音频智能处理技术

视音频智能处理技术
技术用途
视音频指纹比对检索
广告检索、节目定位
视音频重复性检测
新广告发现、新节目检测
视音频指纹训练
广告模板和节目片花模板的训练
滚动与挂角广告检测
滚动广告和挂角广告检测
连续语音识别
把新闻节目的语音转换成文本
字幕提取与识别
把新闻节目视频上的文字转换成文本
新闻自动拆条
把新闻节目拆成新闻条目
语音关键词检测
检测语音关键词,得到专题视音频时段
视音频切分预处理
把语音切成句子,并进行音频分类等预处理
数据解码
从各种格式的视音频数据提取关键帧,并转换成引擎处理需要的数据格式


    3.结论
    本文介绍了一个基于视音频智能处理技术的广播电视内容综合监测系统,该系统获得过国家广电总局2009年度科技创新一等奖,已成功应用于成都、上海、北京等地多个广播电视监测与管理部门,从实际运行的实践来看,该系统大大减轻了人工监测的工作强度,有效的解决了新形势下广播电视内容监测带来的挑战。