Z好举个例子说明一下。... Z好举个例子说明一下。
当然不一样了啊。主要从下面几点来看:
功能和服务
舆情监测系统的数据是经过清洗、过滤、抽取、分析和挖掘的,舆情监测系统的主要功能并不只是提供简单的舆情信息搜索,而是具有全网搜索、定向监测、自动发现,自动预警,趋势分析,自动分类等功能,具有丰富的统计结果。
而互联网搜索引擎只能提供相关的搜索服务,要靠人工主动去搜索,搜索结果出于商业利益的驱动,掺杂很多的不合理的因素,准确性、可用性不强。全面性和及时性方面完全不能满足舆情监控的需要。
简单来说,舆情监测系统不是“小百度”,“小谷歌”,它不希望用户通过传统搜索的方式机械、重复、费力地去“寻找”舆情信息,而是当互联网上diyi时间出现“与我相关”的舆情信息时,以直观、方便的方式“通知”用户,或者借助短信、邮件等方式进行预警。ZD你可以参考看一下西盈舆情监测系统,他们的搜索范围很广,及时预警都是行业内做的很不错的。
■ 采集范围和深度
舆情监测系统所采集的信息范围主要是定向的,是用户关注的特定区域、特定领域的网站,针对这些网站可以做到全面采集和jing准采集。虽然baidu/google等互联网搜索虽然采集范围广泛,但是针对具体的舆情载体,采集深度不够,采集不全面。
目前搜索引擎的数据采集采用的是广度优先策略,会根据url地址进行重复采集的控制。对于论坛、贴吧等舆情载体不会按照主贴、跟帖、翻页的方式进行精确采集,采集深度满足不了舆情监控应用的需要。
西盈网络信息雷达系统专门针对西盈网络舆情监测(监控)系统和西盈竞争情报系统开发而成的,深度挖掘技术超越了google等以智能化和广度见长的搜索引擎爬虫系统。
■ 更新速度
舆情监测系统用户可以自己设置采集的更新频率,对于舆情高发的载体网站可以做到分钟级的更新,这一点互联网搜索引擎是无法达到的。互联网搜索引擎的采集周期一般都是数天或者数周,甚至会出现漏采,无法采集的情况。
■ 采集网站的种类
舆情监测系统可以做到对新闻、论坛、博客、贴吧、微博等舆情载体的全面采集,尤其是针对论坛(包括跟帖),贴吧等这些“草根”网站(这些媒体往往是舆情高发区域),实现全面、迅速的舆情采集的同时,可以实时更新信息的点击数,回复数,转载数等等。而互联网搜索引擎大多是采集新闻网站,而对于论坛,贴吧、博客等等往往无能为力,更无法提供舆情分析需要的统计数据。
随着互联网的发展,微博越来越成为舆情监测的ZD载体,大家都知道,微博是一种对搜索引擎(网页爬虫)不友好的网站形式,谷歌等互联网搜索引擎巨头也难以通过技术手段获取微博数据。但是,西盈网络信息雷达系统采取的“定向钻取”技术可以有针对性,有ZD地采集新浪、腾讯等ZD微博网站上与用户相关的舆情信息。
■ 采集数据的有效性
互联网搜索引擎所采集的数据,往往是没有经过过滤的,甚至充斥着大量的广告等垃圾信息。这些信息往往可以作为舆情的并不多。而舆情监测系统所采集的数据全部都是有效的,和用户相关的,真正称之为舆情的数据。
■ 舆情信息的储存和利用
互联网搜索引擎中的数据,用户没有任何干预的手段,只能通过其提供的固定的搜索服务进行访问。舆情监测系统的信息通过结构化抽取之后,是储存在用户本地的,可以进行归档,分析利用以及作为其他应用系统的数据来源。
■ 相关信息的数量
百度和谷歌等互联网搜索引擎虽然拥有多的数据量,但是对于和用户相关的舆情信息,由于其没有定向采集全面,深度等优势,其收录数量就会大大低于舆情监测系统。另外,舆情监测系统集成了互联网搜索引擎的元搜索功能。可以整合多个搜索引擎的搜索数据。
■ 总结
成功的舆情监测系统是主动告知用户Google等搜索引擎中或收录或没有收录的与“我”相关的舆情信息。重大事件及时预警,并提供量化的统计分析数据助力舆情分析,通过自动生成舆情报告等方式辅助舆情工作。