|国家预印本平台
首页|搜索引擎的渐增式爬行和备份式更新模式

搜索引擎的渐增式爬行和备份式更新模式

Incremental Crawling and Shadowing Update Strategy

中文摘要英文摘要

本文介绍了搜索引擎的总体结构,分析了搜索引擎中爬行器的爬行策略和网页库的更新模式, 介绍了其中一种较为合理的爬行和更新模式及其实现技术,实现了渐增式地爬行高质量的网页,提高网页 库新鲜度的目的。

his paper analyses the general architecture of search engine, especially the design and implementation technology of the crawling and update strategy, the crawler can download “high quality” web pages incrementally and maintain the web repository “fresh”

邵志清、沈文勤

计算技术、计算机技术

搜索引擎爬行器网页库更新策略

search enginecrawlerWeb repositoryupdate strategy

邵志清,沈文勤.搜索引擎的渐增式爬行和备份式更新模式[EB/OL].(2003-12-22)[2025-08-23].http://www.paper.edu.cn/releasepaper/content/200312-37.点此复制

评论