关于中国Deep Web的规模、分布和结构
日期:2007.01.01 点击数:6
【类型】期刊
【刊名】小型微型计算机系统
【资助项】2005年度教育部科研重点项目(205059)资助;教育部“高校博士学科点科研基金项目”(20040285016)资助;江苏省高技术研究计划项目(BG2005019)
【摘要】随着Web数据库的广泛应用,Web正在加速的"深化",大量的高质量的信息隐藏在Deep Web中.基于IP采样的方法,对1,000,000个IP样本进行了分析统计,揭示了2006年初中国Deep Web的规模、分布和结构.主要结论包括有:①中国Deep Web查询接口往往位于站点浅层,94.6% 的Deep Web查询接口出现在站点的前3层;②中国Deep Web大约有24,000个站点,28,000个Web数据库和74,000个查询接口;③中国Deep Web大部分是非结构化的,其中64%是非结构化的Web数据库;④中国Deep Web分布于多种不同的主题领域;⑤目前主要的中文搜索引擎已覆盖国内Deep Web大约二分之一的页面.
【年份】2007
【期号】第10期
【页码】1799-1802
【作者单位】苏州大学智能信息处理及应用研究所 江苏苏州
【全文挂接】获取全文