题目内容
(请给出正确答案)
[单选题]
在网络爬虫策略中需要根据链接计算网页重要性的是以下哪个算法()?
A.深度优先
B.OPIC
C.广度优先
D.局部PageRank策略
答案
查看答案
A.深度优先
B.OPIC
C.广度优先
D.局部PageRank策略
第1题
A.比较适合垂直搜索或站内搜索
B.处于较浅目录层次的页面都可以首先被爬行
C.爬虫在完成一个爬行分支后返回到上一链接节点进一步搜索其它链接,直到所有链接遍历完
D.其基本方法是按照深度由低到高的顺序,依次访问下一级网页链接,直到不能再深入为止
第2题
B.为搜索引擎从万维网上下载网页,是搜索引擎的重要组成部分
C.爬虫从一个或若干个初始网页的URL开始,获得初始网页上的URL,在抓取网页的过程中,不断从当前页面上抽取新的URL放入队列,直到满足系统的一定停止条件
D.网络爬虫的行为和人们访问网站的行为是完全不同的
第3题
A.增量式网络爬虫
B.深层网络爬虫
C.通用网络爬虫
D.聚焦网络爬虫
第5题
A.负载均衡SLB
B.弹性伸缩AutoScaling
C.云数据库RDS
D.专有网络VPC
第8题
A.利用ETL工具将分布的、异构数据源中的数据,抽取到临时中间层后进行清洗、转换、集成,最后加载到数据仓库或数据集市中
B.利用日志采集工具把实时采集的数据作为流计算系统的输入,进行实时处理分析
C.利用网页爬虫程序到互联网网站中爬取数据
D.对分析结果进行可视化呈现,帮助人们更好地理解数据、分析数据