做网站被网警找,双流区规划局建设局网站,福建省城乡建设官方网站,东莞网络推广前言
大家早好、午好、晚好吖 ❤ ~欢迎光临本文章 本来是不玩原神的#xff0c;但是实在是经不住双重诱惑呀~
毕竟谁能拒绝角色风景超级好看又可以爬树、炸鱼、壶里造房子、抓小动物、躲猫猫的游戏捏~ 今天点进官网~角色得配音让我沉陷其中#xff0c;于是
我决定把他们爬…前言
大家早好、午好、晚好吖 ❤ ~欢迎光临本文章 本来是不玩原神的但是实在是经不住双重诱惑呀~
毕竟谁能拒绝角色风景超级好看又可以爬树、炸鱼、壶里造房子、抓小动物、躲猫猫的游戏捏~ 今天点进官网~角色得配音让我沉陷其中于是
我决定把他们爬下来~嘿嘿嘿下面给大家分享一下我的成果 更多精彩内容、资源皆可点击文章下方名片获取此处跳转 准备工具 准备模块
import requests
import re
import execjs请求链接 也就是原神官网 本次目标
所有角色的 基础介绍 中日语音 图片 分析数据来源
1.右键点击检查开发者工具 2.刷新网页找准对应数据 代码展示
url https:///main/character/liyue?char1
html_data requests.get(url).text
print(html_data)筛选数据 随便搜索网站内包含内容“南十字” 使用正则表达式匹配数据内容 js_text re.findall(window.__NUXT__(.*);, html_data)[0]执行结果
html_data requests.get(url).text
js_text re.findall(window.__NUXT__(.*);, html_data)[0]
result execjs.eval(js_text)此时会出现编码问题 加指定编码
import subprocess
from functools import partial
subprocess.Popen partial(subprocess.Popen, encodingutf-8)再次运行无报错 使用pprint查看数据结构
pprint.pprint(result)返回网页查看我们需要的内容 打印所需数据
charList result[data][0][charList]
for char in charList:cover1 char[cover1]title char[title]intro char[intro]audio_list char[cv][0][audio]print(title, intro, cover1, audio_list)部分效果展示 尾语
好了今天的分享就差不多到这里了
完整代码、更多资源、疑惑解答直接点击下方名片自取即可。
对下一篇大家想看什么可在评论区留言哦看到我会更新哒(ง •_•)ง
喜欢就关注一下博主或点赞收藏评论一下我的文章叭 最后宣传一下呀~更多源码、资料、素材、解答、交流皆点击下方名片获取呀