22春学期(高起本1709、全层次1803-2103)《网络爬虫与信息提取》在线作业答卷

作者:奥鹏周老师 分类: 南开大学 发布时间: 2022-05-21 14:21
22春学期(高起本1709-1803、全层次1809-2103)《网络爬虫与信息获取》在线作业-00001
试卷总分:100得分:100
一、单选题 (共 20 道试题,共 40 分)
1.假如运用Python的数据结构来做类推的话,MongoDB中库适当于一个大字典,大字典里边的每一个键值对都对应了一个调集,Key为(),Value即是一个调集。
A.字典
B.调集的姓名
C.调集
D.文档
答案:

2.Redis若要进入交互环境,需求翻开终端输入()
A.redis-cli
B.redis
C.redis-cmd
D.redis-start
答案:

3.xpath中extract方法回来值类型是()
A.列表
B.元组
C.字典
D.调集
答案:

4.Scrapy自带的待爬行列是()
A.deque
B.queue
C.list
D.lqueue
答案:

5.请问按哪个键能够翻开Chrome自带的开发者东西()
A.F10
B.F1
C.F11
D.F12
答案:

6.效劳器端记载信息断定用户身份的数据是
A.session
B.cookies
C.moonpies
D.localstorage
答案:

7.以下关于Charles的说法正确的是( )
A.Charles是一个跨渠道的HTTP抓包东西,能够截取HTTP或许HTTPS恳求的数据包
B.Charles有Windows 32/64版和Linux 64 版,可是当前还没有对Mac OS进行有用的撑持。
C.Charles上面翻滚的数据即是当前计算机建议的数据包。单击东西栏上面的黄色笤帚图标,能够清中止抓包。
D.在Charles发动时,系统自带阅读器的有些HTTP流量不会通过Charles。
答案:

8.MongoDB中数据存储的方式相似于()
A.列表
B.元组
C.字典
D.调集
答案:

9.一般来说在页面传输登录信息都用HTTP()恳求类型
A.GET
B.POST
C.PUT
D.SEND
答案:

10.运用了RedisSpider作为爬虫的父类今后,爬虫会直接监控()中的数据,并不读取start_urls中的数据。
A.Redis
B.RedisSpider
C.Spider
D.MongoDB
答案:

11.当需求把Python里边的数据发送给网页时,需求先变换成()字符串
A.Python
B.Json
C.正则表达式
D.Ajax
答案:

12.lxml库中etree模块的()方法把Selector对象变换为bytes型的源代码数据
A.etree.tostring
B.etree.convertBytes
C.etree.toBytes
D.etree.convertstring
答案:

13.Python中以下哪个容器里的元素不能重复()
A.列表
B.元组
C.字典
D.调集
答案:

14.一般运用()东西来模仿阅读器进行爬虫恳求
A.Selenium
B.Chrome
C.ChromeDriver
D.WebDriver
答案:

15.下面Python代码输出为(): def default_para_trap(para=[], value=0): para.append(value) return para print(\'榜首步:{}\'.format(default_para_trap(value=100))) print(\'第二步:{}\'.format(default_para_trap(value=50)))
A.榜首步:[100] 第二步:[100,50]
B.榜首步:[100] 第二步:[50]
C.榜首步:[100] 第二步:[]
D.榜首步:[100] 第二步:[100]
答案:

16.Python中若界说object=[1, 2, 3, 4, 5],则print(object[:3])输出()
A.12
B.123
C.23
D.234
答案:

17.运用Xpath结构特点值包括一样字符串的途径选用()方法
A.contain
B.contains
C.include
D.includes
答案:

18.运用UI Automatorr长按点击的操作是得到相应控件后运用指令()
A.longclick
B.long_click
C.clicklong
D.click_long
答案:

19.HTTP常用状况码标明效劳器上没有恳求的资源的是()
A.500
B.503
C.403
D.404
答案:

20.Scrapy_redis是Scrapy的"()",它现已封装了运用Scrapy操作Redis的各个方法
A.组件
B.模块
C.控件
D.单元
答案:

二、多选题 (共 10 道试题,共 20 分)
21.Python中有哪些完成多线程方法()
A.multiprocess.dummy
B.threading.Thread
C.process
D.PyMongoDB
答案:B

22.最多见的HTTP恳求类型有()
A.GET
B.POST
C.SEND
D.RECEIVE
答案:B

23.Redis中的值能够撑持()
A.列表
B.哈希
C.调集
D.有序调集
答案:BCD

24.常用的会话盯梢技术是
A.session
B.cookies
C.moonpies
D.localstorage
答案:B

25.以下哪种方法是MongoDB的查找方法()
A.find
B.find_one
C.finds
D.find_all
答案:B

26.对于解析源代码的BeautifulSoup对象,结构时BeautifulSoup(网页源代码, \'解析器\')中的解析器能够为()
A.html
B.html.parser
C.lxml
D.xml
答案:

27.Python中一个函数能够有()个return句子
A.0
B.1
C.多个
D.2
答案:BCD

28.Python中的容器有()
A.列表
B.元组
C.字典
D.调集
答案:BCD

29.Python中一个函数没有回来值则能够写()
A.没有return
B.return
C.return None
D.return NULL
答案:BC

30.下列关于在IOS上装备charles的说法正确的是()
A.不一样ios设备之间会有对比大的不同,所以装备的时分需求找到对应的装置证书的进口。
B.手机和电脑需求在同一个局域网下。
C.HTTP署理能够运用"自动"选项。
D.装置好证书今后,翻开iOS设备上的任何一个App,能够看到Charles中稀有据包在活动
答案:

三、答案来历:熊猫奥鹏(www.188open.com) (共 20 道试题,共 40 分)
31.Python中运用下面代码翻开文件也需求对文件进行close封闭操作 with open(\'文件途径\', \'文件操作方法\', encoding=\'utf-8\') as f
答案:错误

32.在charles中运用CTRL+F查找,JSON里边的中文是能够直接查找到的。
答案:错误

33.Scrapy每一次建议恳求之前都会在这儿检查网址是不是重复。因而假如的确需求再一次爬取数据,在Redis中把这个Key删去即可。
答案:正确

34.刺进数据时,MongoDB会自动增加一列"_id",也即是自增ID,每次自动加1
答案:错误

35.Python正则表达式中".*"是贪婪形式,获取最长的满意条件的字符串。
答案:正确

36.运用Scrapyd,能够完成一键布置Scrapy爬虫,拜访一个网址就发动/中止爬虫
答案:正确

37.Python中元组生成今后还能够往里边继续增加数据,也能够从里边删去数据;
答案:错误

38.假如方针网站自身即是供给大众查询效劳的网站,那么运用爬虫是合法合规的。
答案:正确

39.HTTP状况码302与307彻底同义。
答案:正确

40.假如元组里边只要整数、浮点数、字符串、一个列表,就既不能增加数据,也不能删去数据,还不能修正里边数据的值。
答案:错误

41.HTTP状况码302表明资源持久重定向。
答案:错误

42.运用异步加载技术的网站,被加载的内容能够在源代码中找到
答案:错误

43.Python中条件句子在运用and衔接的多个表达式中,只需有一个表达式不为真,那么后边的表达式就不会履行。
答案:正确

44.当运转爬虫代码后,呈现"Forbidden by robots.txt"提示后,阐明当时时刻段被爬取的网站无法拜访。
答案:错误

45.在恳求头中设置User-Agent即可正常恳求网站
答案:错误

46.爬虫中心件的激活需求别的写一个文件来进行
答案:错误

47.在Ubuntu下若要运转Redis能够运用CMD进入解压今后的文件夹并运转指令redis-server.exe redis.windows.conf发动Redis
答案:错误

48.当运用Charles监控iOS设备或许Android设备的数据包今后,翻开微信小程序,小程序的数据包不能自动被Charles捉住,需求另作处理。
答案:错误

49.charles装备中,装置完结证书今后,在设置中翻开"关于本机",找到最下面的"证信件任设置",并在里边发动对Charles证书的彻底信赖。
答案:正确

50.Python中写CSV文件的writerows方法参数为字典类型
答案:错误

作业答案 联系QQ:3326650399 微信:cs80188