系统开发

SYSTEM DEVELOPMENT

大数据影响力调查分析系统

系统概述

大数据时代带来了新媒体的挑战和机遇。新媒体的本质就是数据分析,大数据时代的数据分析以个人用户为基本单位 ,建立的却是全面、完整、动态、实时的网络行为模式以及在此基础上归纳出来的群体行为模式--网络影响力。 网络影响力是指某一对象在网络这个虚拟世界中的影响力,包含知名度、关注度和美誉度三个指标。知名度指标, 指的是由正式机构(网络媒体)发布的关于某一对象网上信息量的总和。这一指标表明了某一对象的信息在网络中传播的广度。 关注度指标,指的是某一对象在网络各大论坛以及博客中被讨论的程度,被讨论次数越多表明该对象越受关注。 这一指标表明某一对象在网络中的信息传播深度。网络美誉度指标,指的是网友对某一对象评价所持的满意及赞美程度。 三大指标的加权平均之和即为最终网络影响力指数。

总体框架

性能特点

大数据影响力调查分析系统的主要功能特点包括: 科学的网络影响力指标体系:基于媒体专家多年的课题研究成果,构建了以知名度、关注度、美誉度等为核心的网络影响力指标体系,并可根据用户需求灵活构建个性化的网络影响力指标。
先进的信息挖掘统计分析 :系统融合了IBM中国研究院、微软亚洲研究院、中科院等10余年先进的科研成果,内置自动分类、自动聚类、自动摘要、话题探测和追踪、褒贬倾向性分析等国际领先的分析挖掘算法。
易用的分析管理服务界面 :系统贴近网络影响力应用实际需求,基于精简易用性准则设计,使用界面、数据源、关注信息、报告内容与模板均可方便定制。

功能描述

大数据影响力调查分析系统按功能划分为四大部分:

规划定制子系统:

设定影响力指标:系统在默认提供的知名度、关注度、美誉度等核心影响力指标的基础上,开可以根据需求灵活定义个性化的影响力指标,如影响力传播度、意见领袖关注度、水军炒作度等。
定制特定网站:可自主设置网站的地址、特定的关键字及其逻辑规则。
定制监测目标:可设置关键字定制监测目标,设置关键字的逻辑关系、获取范围、所属目录等信息,日后可以重新修改和删除。

舆情采集抽取子系统:

多通道高效采集 :针对论坛、新闻及评论、博客、微博、视频等动态网络信息源,实现可扩展的多通道高效采集技术。
网页元信息抽取 :实现半结构化/无结构化网络资源的元信息抽取,针对新闻、论坛、博客等数据源,实现标题、日期、作者、来源等要素全自动数据抽取。
影响力要素增量提取 :实现社会网络中用户访问行为的要素分析与提取,如点击量、回复量、访问IP等,实现按天和按时段的增量采集抽取。

挖掘分析子系统:

网络热点发现 :基于热点探测技术,自动发现最有影响力的热点。
事件话题溯源 :实现网络事件的重要进程识别与自动回放技术;分析网络事件传播的时间、空间结构,发现网络事件话题源头。
网络对象跟踪 :基于特定网络对象(人、组织、事件),进行对象背景信息的综合提取,追踪最新的事件动态、关系网络等相关信息,在此基础上形成定期综合报告。
美誉度分析 :对网络对象内容与评论作美誉度分析,美誉度反映了网民的情感色彩与倾向,以及褒贬的程度,系统自动区分文本内容与评论的主客观倾向性,给出正面、中立或负面美誉度判定。
影响力计算 :自动计算网络对象的知名度、关注度、美誉度,并加权计算影响力指数。

统计报告子系统:

可视统计分析 :提供网络影响力实时排行榜和动态趋势可视化统计分析 ,包括特定时间内影响力增量变化统计、变化趋势分析等。影响力雷达图 :基于网络影响力知名度、关注度、美誉度构建网络影响力雷达图 。
网页快照追溯 :自动快照取证并提供实时追溯网络影响力监控结果。