邮箱登陆

公告栏更多>
新闻动态更多>
关于联盟
  • 北京数字太和科技有限责任公司
  • 北京版银科技有限责任公司
  • 中国科学院自动化研究所
  • 北京同方易豪科技有限公司
  • 北京国泰信安科技有限公司
  • 中国人民大学
  • 北京泛亚精致传媒制作有限公司
  • 北京理工雷科电子信息技术有限公司
  • 北京云视天创网络科技有限公司
  • 北京亚细亚智业科技有限公司
  • 天柏宽带网络科技(北京)有限公司
  • 北京慧点东和信息技术有限公司
  • 北京星天下信息技术有限公司
  • 北京安顺知达网络技术有限公司
  • 北京纽曼腾飞科技有限公司
  • 东华软件股份公司
  • 富丽年华(北京)文化发展有限责任公司
  • 天津中科蓝鲸信息技术有限公司
  • 北京市中视朗域纪录片文化传播中心
  • C3D产业联盟公共服务中心
  • 清华大学深圳研究所院
技术创新展示当前位置:主页 > 技术创新展示 >

海量内容处理的语音检索系统(Pattek SIR v.1.5)系统

发布时间:2012-01-13 10:06  被阅览数:  来源:未知

 

技术背景及概况

进入二十一世纪,以数字媒体技术、网络技术与文化内容相融合而产生的数字内容产业在世界各地高速成长。随着各级广播电视制作发布单位、广播电视监测部门以及互联网音视频社区中各类音视频形式数字音视频内容的迅速膨胀,目前基于简单元数据标签(tag)以及粗放分级编目的手工信息索引方式,不仅费人费时、容易出错,且日益无法满足使用者精确、负责和个性化检索的需求。 

技术性能

中科院自动化研究所具有20多年语音技术研究的基础,结合实际业务单位的特点和需求,率先开发成功了面向海量内容处理的语音检索系统(Pattek SIR v.1.5)系统。该系统将先进的语音综合处理技术应用于广播电视音视频节目检索与管理,设计目标是让用户可以像使用“谷歌、百度”检索文本一样方便地对语音内容进行检索。 

Pattek SIR v.1.5产品应用功能框架 

    在全面分析海量视音频库中广播电视节目管理和服务需求基础上,Pattek SIR v.1.5具有以下功能:

   1. 对语音内容自动、快速建立索引,预处理能力强;

   2. 提供文字和语音输入的语音内容检索服务,定位准确度高,检索速度快,并具有模糊检索能力;

   3. 强大的索引和检索数据以及系统管理功能,提供与媒体资产管理和内容服务系统的接口。 

技术特性

   1. 先进的语音处理技术:根植中科院自动化所积累20年研究经验和成果,具备国内领先世界一流的语音语言、音视频处理技术;

   2. 先进的系统架构:采用J2EE技术和多层结构设计支持跨平台应用,全浏览器(B/S)模式,零客户端维护,集成化管理,适合各类企业应用;

   3. 领先的海量音视频数据处理能力:集成稳定、高效、可扩展的集群并行计算基础运行环境,支持万小时量级的媒体索引和快速检索;

   4. 面向行业定制的应用接口:可根据行业媒体资产管理和个性化服务的要求,定制可扩展的输出接口;

   5. 灵活的接口模式:支持各种常见的视音频格式(mp3、wmv、wma、rm、avi等)和多种API开发接口,满足多种开发和应用集成环境的要求;

   6. 优异的产品性能:Pattek在广播电视行业海量音视频内容处理、信息发现领域多个成功应用的基础上开发而成。 

应用领域

   1. 各级广播电视内容采集、制作、编目、管理、发布、服务单位;

   2. 各级广播电视内容监测与管理单位;

   3. 互联网音视频社区网站。