南开22秋学期(高起本1709-1803、全层次1809-2103)《网络爬虫与信息提取》在线作业【标准答案】

作者:奥鹏周老师 分类: 南开大学 发布时间: 2022-12-26 09:28

作业答案 联系QQ:3326650399 微信:cs80188

22秋学期(高起本1709-1803、全层次1809-2103)《网络爬虫与信息获取》在线作业-00001

试卷总分:100 得分:98

一、单选题 (共 20 道试题,共 40 分)

1.Python在Windows途径字符串左引号的左面加()符号来防止反斜杠疑问

A.s

B.c

C.d

D.r



2.运用UI Automator获取屏幕上显现的文本内容的操作是得到相应控件后运用指令()

A.content

B.text

C.title

D.body



3.Python中Object={1, 2, 3, 4, 5},则Objcet是()

A.调集

B.字典

C.列表

D.元组



4.运用UI Automatorr让屏幕向左翻滚的操作是得到相应控件后运用指令()

A.scroll.left

B.scroll.horiz.left

C.scroll.forward

D.scroll.horiz.forward



5.chrome默许翻开开发者东西的方便是

A.F5

B.F11

C.F12

D.F2



6.Python中把列表变换为调集需求运用##函数

A.set

B.list

C.convert

D.change



7.Python中越过本次循环应用关键词()

A.break

B.continue

C.exit

D.return



8.PyMongo中逻辑查询表明大于等于的符号是()

A.$gt

B.$lt

C.$gte

D.$lte



9.PyMongo中逻辑查询表明小于的符号是()

A.$gt

B.$lt

C.$gte$$lte



10.能够经过()绕过网站登录。

A.session

B.cookies

C.moonpies

D.localstorage



11.requests中post恳求方法的运用为requests.post(\'网址\', data=data)中的data为()

A.列表

B.元组

C.字典

D.调集



12.在Linux中哪个指令是增加权限的()

A.chmod

B.sudo

C.cp

D.mkdir



13.在Scrapy的目录下,哪个文件担任寄存爬虫文件?()

A.spiders文件夹

B.item.py

C.pipeline.py

D.settings.py



14.Python中退出循环应用关键词()

A.break

B.continue

C.exit

D.return



15.Python中专门用来处理图画的第三方库是

A.lxml

B.Pillow

C.beautifulsoup

D.pytesseract



16.Python中Object={\'obj_1\':\'1\',\'obj_2\':\'2\'},则Objcet.get(\'boj_1\',\'3\')是()

A.1

B.2

C.3

D.无输出



17.运用UI Automatorr判别元素是不是存在的操作是得到相应控件后运用指令()

A.exist

B.exists

C.isnull

D.contains



18.运用UI Automator使屏幕向上翻滚一屏的操作是得到相应控件后运用指令()

A.scroll_forwad

B.scroll_up

C.scroll.forward

D.scroll.vert.forward



19.假如运用Python的数据结构来做类推的话,MongoDB中文档适当于一个()

A.列表

B.元组

C.字典

D.调集



20.当需求把Python里边的数据发送给网页时,应先将其变换成()

A.Json字符串

B.GET

C.POST

D.Request



二、多选题 (共 10 道试题,共 20 分)

21.Python中的容器有()

A.列表

B.元组

C.字典

D.调集



22.Python中()容器有推导式

A.列表

B.元组

C.字典

D.调集



23.MongoDB中获取姓名为db的库的句子为()

A.client.db

B.client(\'db\')

C.client[\'db\']

D.client{\'db\'}



24.以下HTTP状况码表明效劳器自身发作错误的是

A.400

B.503

C.302

D.500



25.cookies的缺陷是

A.完成自动登录

B.盯梢用户状况

C.http中明文传输

D.添加http恳求的流量



26.requests中post恳求方法的第二个参数能够为()

A.字典

B.列表

C.json数据

D.字符串



27.以下哪些能够独立变成Python编译器()

A.Pycharm

B.IDLE

C.Eclipse

D.Visual Studio 2010



28.一个可行的自动替换署理的爬虫系统,大概下列哪些功用?

A.有一个小爬虫ProxySpider去各大署理网站爬取免费署理并验证,将能够运用的署理IP保留到数据库中

B.在发现某个恳求现已被设置过署理后,啥也不做,直接回来

C.在ProxyMiddlerware的process_request中,每次从数据库里边随机挑选一条署理IP地址运用

D.周期性验证数据库中的无效署理,及时将其删去



29.HTTP常用状况码标明恳求被正常处理的有()

A.200

B.301

C.302

D.204



30.Python中一个函数能够有()个return句子

A.0

B.1

C.多个

D.2



三、判别题 (共 20 道试题,共 40 分)

31.假如经过爬虫抓取某公司网站的揭露数据,剖析今后发现这个公司成绩十分好,所以买入该公司股市并赚了一笔钱。这是合法的。



32.一般来说在页面都经过GET将用户登录信息传递到效劳器端。



33.MongoDB是一个关系数据库商品



34.PyMongoDB中排序方法sort第二个参数-1表明升序



35.Python正则表达式中“.*”是贪婪形式,获取最长的满意条件的字符串。



36.上课传纸条。A要把纸条传给B,可是A与B间隔太远,所以让C来转交纸条。此刻,C先篡改纸条的内容再传给B,这是一品种似抓包的方法。



37.Charles是一个收费软件,假如没有注册,装置今后的前30天能够正常运用。30天今后,尽管功用不会缩水,但每过30分钟Charles会自动封闭一次



38.运用AJAX技术,能够在不改写网页的状况下更新网页数据



39.Redis中运用lrange读取数据后数据也会删去



40.Selenium有必要加载对应的webdriver才干模仿阅读器拜访



41.Redis刺进数据都是刺进到列表右侧,因而读取数据也是从右侧读取



42.Redis中查询列表长度指令llen中l代表left,即从左边开端数



43.Python中函数回来值的个数能够是多个



44.运用Charles直接抓取HTTPS的数据包,就会呈现很多的Method为CONNECT的恳求,可是这些恳求又悉数都会失利,是没有装置SSL证书致使的



45.Python中元组生成今后还能够往里边继续增加数据,也能够从里边删去数据;



46.UI Automator Viewer与Python uiautomator能够一起运用



47.为了在安卓手机上装置证书,需求先发送证书到手机里边。在Charles中挑选“Help”-“SSL Proxying”-“Save Charles Root Certificate”指令,能够将Charles的证书保留到计算机桌面。



48.运转MongoDB今后,不会在终端打印任何Log



49.在Linux的终端运用apt-get指令装置一系列依靠库时,其间假如存在有现已装置的库,会掩盖掉之前的库从头装置



50.”curl http://爬虫效劳器IP地址:6800/cancel.json -d project=工程名 -d job=爬虫JOBID“该指令的效果是发动爬虫

作业答案 联系QQ:3326650399 微信:cs80188