当前位置: 首页 > news >正文

神马收录提交入口湛江网站seo外包

神马收录提交入口,湛江网站seo外包,网站建设网络推广书生,怎么用dw制作网站又是一年高考时#xff0c;祝各位学子金榜题名#xff0c;天遂人愿! 在您阅读以下内容时#xff0c;请注意#xff1a;各省查分API接口可能不相同#xff0c;本人仅就技术层面谈谈#xff0c; 纯属无聊#xff0c;因为实用意义不大#xff0c;毕竟一年一次#xff0c;…又是一年高考时祝各位学子金榜题名天遂人愿! 在您阅读以下内容时请注意各省查分API接口可能不相同本人仅就技术层面谈谈 纯属无聊因为实用意义不大毕竟一年一次查询接口可能每年都变 在每年高考成绩公布前夜人们通常会守候在电脑前查询成绩。但实际上若了解了查询接口就能利用爬虫自动获取成绩并通过微信推送接口(Server酱)将信息直接发送至微信。 要定时查询一个学生的高考分数并将结果推送到微信上可以按照以下步骤进行 步骤一导入所需的库 首先我们导入需要使用的 Python 库包括 requests、schedule 和 time。 import requestsimport scheduleimport time 步骤二定义 ping_website 函数 编写一个函数 ping_website(url) 来检查网站状态码是否为 200。如果状态码不是 200则等待10秒后重新尝试。 def ping_website(url):response requests.head(url)return response.status_code 步骤三定义 crawl_data_and_send_to_wechat 函数 创建一个函数 crawl_data_and_send_to_wechat()在其中执行数据爬取并调用 Server酱接口将数据推送到微信。  def crawl_data_and_send_to_wechat():website_url 查询分数的API接口while ping_website(website_url) ! 200:print(查询接口还没有开放. 等待10秒钟后再试...)time.sleep(10)# 数据爬取逻辑print(爬取分数...)# 模拟爬取的数据crawled_data 结果示例# 使用Server酱推送消息至微信server_chan_url https://sc.ftqq.com/YOUR_SERVER_CHAN_KEY.sendrequests.get(server_chan_url, params{text: Crawled Data, desp: crawled_data})print(数据已通过Server酱发送到微信上) 步骤四定义 job 函数 创建一个 job() 函数在其中调用 crawl_data_and_send_to_wechat() 函数。 def job():crawl_data_and_send_to_wechat() 步骤五设置定时任务 使用 schedule 库来设置每分钟执行一次的任务并在主循环中运行定时任务。  # 设置每分钟执行一次任务schedule.every().minute.do(job)​while True:schedule.run_pending()time.sleep(1) 以下是某省2023年高考成绩查询的接口演示 某省2023年高考查分界面 最后结果界面 查询响应是一个table, 以下敏感信息已用x替代。 div classgkcj-tit2023年xxxxx省普通高等学校招生考试成绩查询结果/div div classbase-info b1table classbase-ttrtd classbase-td姓名/tdtd stylewidth: 168px;xxxxxx/tdtd classbase-td身份证号/tdtdxxxxxxxxxxxxxxxxxxxxxxxx/td/trtrtd classbase-td高考准考证号/tdtdxxxxxxxxxx/tdtd classbase-td高考报名号/tdtdxxxxxxxxxx/td/tr/table /div div classscore-infotable classscore-ttrtd科目名称/tdtd科目成绩/td/trtrtd语文/tdtdxxx/td/trtrtd数学/tdtdxxx/td/trtrtd英语/tdtdxxx/td/trtrtd历史/tdtdxxx/td/trtrtd地理/tdtdxxx/td/trtrtd生物学/tdtdxxx/td/trtrtd总分/tdtd classscore-tcolorxxx/td/tr/table /div div classfha onclickback(); hrefjavascript:void(0); classgkcj-btn返回继续查询/a /div以下程序仅给出了数据查询的程序读者可以根据前面的步骤将数据查询作为一个job, 将能查询到的结果推送到微信上。 在以下程序中主要注意以下几个问题 1、创建同一个会话 2、验证码识别 这里对于验证码识别没有做异常处理有时验证码识别可能错误需重新访问网页获取。 import ddddocr import requests from bs4 import BeautifulSoup# 创建一个会话对象 # 要在一个会话中获取网页的源码提取__RequestVerificationToken的值 # 同时通过接口http://查询成绩服务器IP/Validate/GetValidateCode?获取验证码session requests.Session()# 请求网页获取源码 url http://查询成绩服务器IP/gk/gkcj2023?token98c1234e8d5678bb response session.get(url) html_content response.text# 使用BeautifulSoup解析网页源代码 soup BeautifulSoup(html_content, html.parser) # 从网页源代码中提取到__RequestVerificationToken的值 input_tag soup.find(input, {name: __RequestVerificationToken}) verification_token input_tag[value] print(verification_token)# 从网页源代码中提取验证码图片URL validate_code_url http://查询成绩服务器IP/Validate/GetValidateCode?for img in soup.find_all(img):if ValidateCode in img[src]:validate_code_url img[src]break# 获取验证码图片 response session.get(validate_code_url, streamTrue) if response.status_code 200:with open(captcha_image.png, wb) as out_file:for chunk in response.iter_content(chunk_size128):out_file.write(chunk)# 打印验证码图片保存成功消息 print(验证码图片已保存为 captcha_image.png 文件)# 识别验证码 def imgRecognition(img):try:ocr ddddocr.DdddOcr()with open(img, rb) as f:img_bytes f.read()res ocr.classification(img_bytes)return resexcept:return NonerandCode imgRecognition(captcha_image.png)headers {Accept: image/avif,image/webp,image/apng,image/svgxml,image/*,*/*;q0.8,Accept-Language: zh-CN,zh;q0.9,Cache-Control: no-cache,Content-Type: application/x-www-form-urlencoded; charsetUTF-8,DNT: 1,Origin: http://查询成绩服务器IP,Pragma: no-cache,Proxy-Connection: keep-alive,Referer: http://查询成绩服务器IP/gk/gkcj2023?token98c1234e8d5678bb,User-Agent: Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/125.0.0.0 Safari/537.36,X-Requested-With: XMLHttpRequest } cookies {__RequestVerificationToken_Lw__: lcVcsxDb0RiSVf1wSZeQxzeD9WZ7y4lBW75DkJmLDpT5hiTaxPXlpokbYfDTcEL3ujpDdB9qEezLBdnNZy/C8dYe9o9pJLTUqWeOnAmVWio0bRwhEkNK/jKbQLSE3T2t4rfg,ValidateCode: randCode } url http://查询成绩服务器IP/gk/gkcj2023 # 成绩查询接口 data {zkzh: xxxxxxxxx, # 准考证号ksbh: , # 报名号zjhm: xxxxxxxxx, # 身份证yzm: randCode, # 验证码__RequestVerificationToken: verification_token # 从网页中获取的值 } response session.post(url, headersheaders, cookiescookies, datadata, verifyFalse)# 使用BeautifulSoup解析HTML内容 soup BeautifulSoup(response.text, html.parser)# 提取表格数据 table_data [] for table in soup.find_all(table):for row in table.find_all(tr):cols row.find_all([td])cols [ele.text.strip() for ele in cols]table_data.append(cols)# 保存提取的表格数据到.txt文件 with open(高考成绩.txt, w) as file:for row in table_data:file.write(\t.join(row) \n)print(表格数据已保存为 高考成绩.txt 文件)最后查询结果 各高考查分接口为保障查询速度一般仅采取了简单的反爬措施所以获取结果不是很困难
http://www.yingshimen.cn/news/64748/

相关文章:

  • 网店美工培训教程岳阳优化公司
  • 做服装团购网站马云做网站最开始怎么盈利的
  • 余杭建设局网站网线制作实验报告总结
  • 成都鸿邑网站建设营销网站的建设与管理包括哪些事项
  • 网站要怎么运营网站开发学哪种语言
  • 提供手机自适应网站建设维护企业网站开发开题报告
  • 上海做网站 公司wordpress新页面404
  • dw网站开发无备案网站广告如何做
  • 保姆给老人做爰神马网站网站栏目模板如何选择
  • 贵阳网站开发外包磐安网站建设
  • 新河网站国外 精美 网站
  • 上海网站建设官网企业网站哪家好
  • 江宁区建设局网站wordpress 文章排版
  • 网站建设合同内容网上银行登录
  • 许昌旅游网站建设现状社交网站建设码
  • qq群推广引流免费网站西安网站关键词排名
  • 住房和建设部网站莱芜公司做网站
  • 网站加在线qq荆州seo公司
  • 爱站网seo工具包大良营销网站建设精英
  • 电脑做兼职找那个网站网站建设分金手指排名二八
  • 深入网站开发和运维 pdf手机医疗网站模板
  • app软件下载网站免费进入回复可下载WordPress
  • 招聘网站模板页什么网店可以免费开店
  • 网站推广途径方法工商局官网登录
  • 寻找做项目的网站wordpress天气插件
  • 昆明网站制作维护公众号链接电影网站怎么做
  • 阿里云网站目录专业网站建设公司在线咨询
  • 南京网站外包群晖nas做网站
  • 网站排名恢复泰兴网站建设开发
  • 网站的建设域名空间下载的html模板怎么用