电院要闻
未来媒体网络协同创新中心携手央视打造媒体大数据平台
日期:2017-05-08 阅读:1035

425日,上海交通大学未来媒体网络协同创新中心与中央电视台联合研发的大数据试验平台通过了验收鉴定。该平台是具有自主知识产权的广电大数据技术系统,可提供多种收视分析和个性化推荐服务,也是中央电视台媒体融合重点技术工程之一。未来媒体网络协同创新中心张娅教授领衔的媒体大数据团队承担了主要的研发工作。

验收鉴定会由中央电视台分党组成员姜文波主持。清华大学计算机系学术委员会原主任林闯教授、北京大学计算机系主任黄铁军教授、广播电视规划院副院长谢锦辉教授等业内著名专家参加了验收鉴定。与会专家认真听取了项目工作报告和技术报告,认为该平台采用了先进的Hadoop/Spark技术架构,通过自主研发建立了完整的数据采集、清洗、存储、分析大数据平台,并对15个省级有线电视网实现了用户收视数据的采集,在节目收视评价和用户画像与聚类分析方面进行了创新,达到了国内领先水平,一致同意该项目通过验收。

研发团队经过一年多的技术研究和系统开发,初步建立起具有自主知识产权、可实现数据的自主保存、自主管理、服务于中央电视台有线互动电视端和移动客户端的用户大数据技术平台。该平台支持不同来源的异构数据的多种导入方式、支持基于流式计算的数据清洗、数据归一化及数据融合,并通过研究提出了一套广电用户收视数据接口规范。

在项目研发过程中,研发团队运用大数据分析手段,对融合媒体的传播规律进行了深入研究,探索和挖掘适用于广播电视的大数据分析算法和分析模型。根据央视专区互动电视的收视行为数据和央视移动客户端的用户行为数据,研究提出了指标计算、热度计算、主题分析、画像分析、聚类分析等分析算法,以支持用户推荐、热播推荐、节目上下架等多种业务需求,在此基础上开发了仪表板、节目分析模块、用户分析模块、指标检索模块、报表模块等服务功能。鉴于互动电视端平均收视时间较长、终端数据通常为家庭收视行为,研发团队采用聚类的方法对互动电视进行用户画像,基于主题的分析模型LDA挖掘用户的兴趣分布,再通过K-means算法对用户聚类,取得了良好的效果。

目前,该系统已开始为央视专区和央视移动客户端提供节目画像和用户画像,并为节目优化和平台服务提供多种收视分析和个性化推荐服务。


Baidu
map