系统开发

SYSTEM DEVELOPMENT

全媒体舆情监控系统

系统概述

全媒体舆情监控系统是基于先进的精准搜索引擎技术和观点挖掘技术,设计实现的一个大型网络舆情监控系统软件。 该系统能够精准定向采集互联网海量舆情信息,追踪互联网上热点敏感话题的发生、发展和变化趋势, 发现和分析社会民众群体在互联网上的观点、态度、意见和看法,特别是及时发现负面报道和不良言论并自动报警, 快速便捷地生成可视化的统计分析报告,最终实现发现舆情、分析舆情、追踪舆情、引导舆情、逆转舆情和控制舆情。

总体框架

功能描述


    全媒体舆情监控系统按功能划分为四大部分:
  • 舆情规划定制子系统:
  • 定制舆情分类:可建立多级舆情分类管理目录,并可对目录进行重命名、删除操作。
  • 定制特定网站:可自主设置网站的地址、特定的关键字及其逻辑规则。
  • 定制监测目标:可设置关键字定制监测目标,设置关键字的逻辑关系、获取舆情的范围、所属目录等信息,日后可以重新修改和删除。

  • 舆情采集抽取子系统:
  • 多通道高效采集 :针对论坛、新闻及评论、博客、微博等动态网络信息源,实现可扩展的多通道高效采集技术。
  • 多媒体数据采集 :可采集文本、图片、音视频等多媒体信息。
  • 主动化定向采集 :主动化采集技术,解决增量更新以及访问控制等问题,实现JavaScript动态网页的采集与客户端解析还原技术。
  • 分钟级实时采集 :多线程高效实时采集技术实现舆情分钟级采集效果。
  • 代理翻墙式采集 :通过代理或者翻墙工具采集境外网站。
  • 网页元信息抽取 :实现半结构化/无结构化网络资源的元信息抽取,针对新闻、论坛、博客等数据源,实现标题、日期、作者、来源等要素全自动数据抽取。
  • 事件要素提取 : 实现社会网络中用户访问行为的要素分析与提取,如点击量、回复量、访问IP等。

  • 舆情分析挖掘子系统:
  • 舆情热点发现 :基于热点探测和层次聚类技术,自动发现舆情热点。
  • 舆情话题溯源 :实现网络舆情的重要进程识别与自动回放技术;分析网络舆情传播的时间、空间结构,发现网络舆情话题源头。
  • 舆情对象跟踪 :基于特定网络对象(人、事件),进行对象背景信息的综合提取,追踪最新的舆情动态、舆情关系网络等相关信息,在此基础上形成定期综合报告。
  • 倾向性分析 :对舆情内容与评论的作倾向性分析,倾向性反映了作者的情感色彩,以及褒贬的程度,自动区分文本内容与评论的主客观倾向性,给出正面、中立或负面倾向性判定。

  • 舆情处置服务子系统:
  • 可视统计分析 :提供舆情动态趋势可视化统计分析,包括特定时间内特定情报的信息量变化统计,特定时间内对特定舆情报道媒体量变化统计等。
  • 舆情摘要报告 :提供选定范围舆情自动摘要,与统计报告自动生成下载,可自动定制与生成可下载打印的日报、周报、月报和快报 。
  • 预警推送服务 :对负面舆情监测预警,及时通过邮件或短信形式通知用户。

性能特点

全媒体舆情监控系统的主要性能特点包括三个方面:
跨平台高性能可扩展架构 :采用基于Java/J2EE体系结构,跨操作系统、跨数据库、跨应用服务器,应用系统按照国家级大型舆情监控应用需求设计高性能扩展架构,并基于实际系统5年运行检验。
独创的精准网络采集抽取 :系统基于独创的网络机器人技术,可以模拟人的行为,实现对论坛、博客、微博、视频、网店等AJAX动态页面上网络对象要素的精准快速采集,如用户点击数、回复数、评论等。
易用的舆情管理服务界面 :系统贴近舆情应用实际需求,基于精简易用性准则设计,使用界面、数据源、关注信息、报告内容与模板均可方便定制。