利用爬虫抓取新理念英语答案 - 静かな森

在此之前,在他人的博客中看到一篇文章新理念外语网络教学平台——获取任意答案,但是写得不是很详细,下面我来详细的说明一下.

原理

首先进入自己学校的平台.打开开发者工具--network,然后登陆

tva2.sinaimg.cn/large/006tNbRwly1fwzr01vvpsj31kw0xqaud.jpg)

可以看到headers和data.并且data中的tbName和tbPwd都没有加密.这是之后我们需要post的包括上面两个_

答案从哪来

如果你此前做过测试并且获得过60分以上的成绩,就可以查看那个习题答案.

我们打开开发者工具-- network.然后查看答案.

我们发现

答案是通过viewTestTask.apsx获取的.其中data中三个数字就代表返回给viewTestTask.aspx来获取测试的答案.

那么我们就需要获取这三个数字.

如何获取三个关键数字

首先我们需要进入本周测试的网页.

然后打开开发者工具--network

抓取

通过viewTestTask.aspx传入header和data进行抓取.

由于先人的代码会造成

UnicodeEncodeError: 'latin-1' codec can't encode characters in position 32-37: ordinal not in range(256)错误,我进行了二次修正.仅供参考.适合版本[新理念英语v6.2]

需要修改的地方已经标注. python版本3.7

实现全自动答题

准备

你需要安装Python3以上版本，并且正确安装Requests库，selenium库，Chrome以及对应的WebDriver。

除此之外你不需要做任何事。

开始

git clone https://github.com/Innei/Auto-AnswerXinLinian.git
cd Auto-AnswerXinLinian
python3 ./main.py

在此之前,在他人的博客中看到一篇文章新理念外语网络教学平台——获取任意答案,但是写得不是很详细,下面我来详细的说明一下.

原理

首先进入自己学校的平台.打开开发者工具--network,然后登陆

tva2.sinaimg.cn/large/006tNbRwly1fwzr01vvpsj31kw0xqaud.jpg)

可以看到headers和data.并且data中的tbName和tbPwd都没有加密.这是之后我们需要post的包括上面两个_

答案从哪来

如果你此前做过测试并且获得过60分以上的成绩,就可以查看那个习题答案.

我们打开开发者工具-- network.然后查看答案.

我们发现

答案是通过viewTestTask.apsx获取的.其中data中三个数字就代表返回给viewTestTask.aspx来获取测试的答案.

那么我们就需要获取这三个数字.

如何获取三个关键数字

首先我们需要进入本周测试的网页.

然后打开开发者工具--network

抓取

通过viewTestTask.aspx传入header和data进行抓取.

由于先人的代码会造成

UnicodeEncodeError: 'latin-1' codec can't encode characters in position 32-37: ordinal not in range(256)错误,我进行了二次修正.仅供参考.适合版本[新理念英语v6.2]

需要修改的地方已经标注. python版本3.7

实现全自动答题

准备

你需要安装Python3以上版本，并且正确安装Requests库，selenium库，Chrome以及对应的WebDriver。

除此之外你不需要做任何事。

开始

git clone https://github.com/Innei/Auto-AnswerXinLinian.git
cd Auto-AnswerXinLinian
python3 ./main.py

Search

利用爬虫抓取新理念英语答案

原理

答案从哪来

如何获取三个关键数字

抓取

实现全自动答题

准备

开始

原理

答案从哪来

如何获取三个关键数字

抓取

实现全自动答题

准备

开始

关键洞察