首页 > 网页设计 > 网页设计编程题-当我的第一个 Python 爬虫尝试爬取题库答案时,我有了一个想法
2023
11-15

网页设计编程题-当我的第一个 Python 爬虫尝试爬取题库答案时,我有了一个想法

①2000多本Python电子书(主流、经典书籍应该都有)

②Python标准库信息(最全中文版)

③项目源码(四十、五十个有趣又经典的实践项目及源码)

④Python、爬虫、Web开发、大数据分析基础介绍视频(适合初学者)

⑤ Python学习路线图(告别不合格的学习)

私信编辑器001获取海量Python学习资源

1. 登录

爬取的题库网站是

→按F12进入开发者模式→选择Network→选择Headers→点击登录→输入错误的账号密码→选择登录→获取几个关键信息

1.请求网址→

2.数据→{用户名:“123”,密码:“123”}

row1到row3:需要使用的第三方库

row5:创建会话以在登录后保留数据

第 6 行:基本 URL

row8到row11:账户密码

row12:传递账号和密码信息。 当我使用 data=username_password 时,出现错误。 查看帖子后发现需要将账户密码json化,于是json=username_password解决了错误。

row13:打印登录信息。 print(rep_login.text) 得到的是文本,很难处理,所以对rep_login进行json()处理得到字典。 获取词典信息更加方便。

2. 搜索主题

你知道吗? 下面的参数是key=123,123就是我需要查找的问题。

搜索完问题后,我们要点击参考答案。 您可以通过右键单击并检查来获得草丛。

row16:将问题信息赋值给变量 timu

第17行:设置参数

row18:请求刚才设置的参数,URL为base_url+"/ddtk/web/search"

row19:将请求的网页信息转换成BeautifulSoup。 获取到的网页信息是一个字符串。 将其转换为BeautifulSoup后网页设计编程题,我们就可以利用它的语法来帮助我们过滤我们想要的数据。 我学习的时候是这么理解的。 有人用微信给我发了100个人的名字,但我很难找到我是否在场,所以我把名字放在word文档中,我可以使用Word的搜索功能来查看我的名字是否存在。立刻就到了。

row21:由于搜索问题后会有多个结果,所以我进行了遍历吉祥物设计,len统计了所有结果。

row22:通过BeautifulSoup找到所有参考答案的href

3. 点击参考答案,进入答案页面。

4. 处理它并得到我想要的真正答案,而不是像选项B那样的答案。

row26:发送get请求,获取应答页面的网页信息

row27:将获取到的信息转化为BeautifulSoup

row29到row32:获取问题信息,使用re模块的正则表达式函数去除问题信息中的所有空格和换行符

row34到row38:获取选项信息,使用正则表达式获取选项信息表情包设计,将每个选项变成列表的一个元素,去掉所有“”值

4.检查答案

点击查看并获取新的网页信息

显示答案为B

row41到row44:从get请求得到答案后网页设计编程题,json()网页信息,通过字典得到答案B

4. 处理它并得到我想要的真正答案,而不是像选项B那样的答案。

因为我把选项放在一个列表中,如果是空集,说明我检查答案后,得到的不是一个选项,而是一个真正的答案。

否则,用下面的判断方法来得到我的答案

如果是选项A,那么列表的第一个元素就是我的答案

结尾 – – –

正如你所看到的,我最终将答案分配给了pipei_answer,因为这样我就不需要像上一篇文章中那样创建一个题库来匹配答案。

我不需要像上一篇文章中那样自己创建一个问题库来匹配答案。

最后编辑:
作者:nuanquewen
吉祥物设计/卡通ip设计/卡通人物设计/卡通形象设计/表情包设计