基于Web的新闻采集系统

日期:2009.01.01 点击数:3

【类型】期刊

【作者】胡静芳 沈亚斌 

【刊名】电脑知识与技术

【关键词】 Web信息采集 正则表达式 采集规则

【摘要】随着Internet的飞速发展,Web已经发展成为一个巨大的信息资源库,但是目前Web数据大都以HTML形式出现,这使得应用程序无法直接利用Web上的海量信息。针对这一问题,出现了Web信息采集技术。该文对信息采集技术进行了探讨,并在此基础上实现了一个基于Web的新闻采集系统,该系统可根据用户使用正则表达式编写的采集规则快速而精确的采集目标网页中的信息,保存在本地数据库中,用于内部使用或外网发布。

【年份】2009

【期号】第19期

【页码】5111-5113

【作者单位】景德镇陶瓷学院信息工程学院;中国直升机设计研究所

【全文挂接】获取全文

3 0
Rss订阅