【python 乱码错误】网页乱码错误解决

某个网址爬出来的网页源代码出现中文乱码
查看源代码可以发现这个网址采用的编码是GBK

# -*- coding: utf-8 -*-


import requests
url='https://www.jb51.net/do/book.html'

import re
# r=requests.get(url)
# r.encoding='GBK'
# html=r.text

html=requests.get(url).text

book_name=re.findall('<h5 class="show-tipinfo"><a href="/books/\d+.html">(.*?)</a></h5>',html,re.S)

for each in book_name:
    print(each)
RÓïÑÔÊý¾Ý·ÖÎöÏîÄ¿¾«½â:ÀíÂÛ¡¢·½·¨¡¢ÊµÕ½ ¸ßÇåpdfÍêÕû°æ[43MB] 
¸ú¹¤³ÌʦѧǶÈëʽ¿ª·¢:»ùÓÚSTM32ºÍ¦ÌC OS-¢ó ´øĿ¼¸ßÇå°æpdf 
È˸ñ»¯µçÉÌ:ÍøºìÓëIPÐÞÁ¶Ö®µÀ ´øĿ¼¸ßÇå°æpdf[35MB] 
µÚÒ»ÐдúÂ롪¡ªÒÔÌ«·» (ÀîÄþÖø) ¸ßÇåpdfɨÃè°æ[203MB]
Python¸ßÐÔÄÜ (µÚ2°æ) ÖÐÎÄpdfɨÃè°æ[109MB]
JavaºËÐļ¼Êõ¼°ÃæÊÔÖ¸ÄÏ ÍêÕûpdfɨÃè°æ[220MB]
MATLAB 2018´ÓÈëÃŵ½¾«Í¨(ʵս°¸Àý°æ) ÖÐÎÄpdf¸ßÇå°æ[371MB]
³ÌÐòÔ±ÐÞÁ¶Ö®µÀ:³ÌÐòÉè¼ÆÈëÃÅ30½² ¸ßÇåpdfÍêÕû°æ[8MB] 
Êý¾Ý¿ÉÊÓ»¯ÓëÊý¾ÝÍÚ¾ò:»ùÓÚTableauºÍSPSS ModelerͼÐνçÃæ ÖÐÎĸßÇåpdfÍêÕû°æ 
²úÆ·¾­Àí±Ø¶®µÄ¼¼ÊõÄǵãʶù:³ÉΪȫջ²úÆ·¾­Àí ÖÐÎĸßÇåpdfÍêÕû°æ
´«ÖǺÚÂí³ÌÐòÔ±webÇ°¶Ë39ÆÚÈ«Ì×ÊÓƵ½Ì³Ì(¾ÍÒµ°à+´úÂë+ÊÓƵ) ÍêÕû°æ
Éî¶ÈѧϰԭÀíÓëʵ¼ù (³ÂÖÙÃúµÈÖø) ¸ßÇåpdfÍêÕû°æ[173MB]
GoÓïÑÔºËÐıà³Ì (ÀîÎÄËþÖø) ÍêÕûpdf¸ßÇå°æ[174MB]
OpenRestyÍêÈ«¿ª·¢Ö¸ÄÏ:¹¹½¨°ÙÍò¼¶±ð²¢·¢µÄWebÓ¦Óà ÖÐÎÄPDFɨÃè°æ[147MB] 
WebÈ«Õ»¹¤³ÌʦµÄ×ÔÎÒÐÞÑø ÖÐÎÄpdfÍêÕû°æ[15MB] 
HTML5+CSS3´ÓÈëÃŵ½¾«Í¨ ÖÐÎÄpdfÍêÕû°æ[229MB]
Êý¾Ý˼ά:´ÓÊý¾Ý·ÖÎöµ½ÉÌÒµ¼ÛÖµ (ÍõººÉú) ÖÐÎÄpdf¸ßÇå°æ[7MB] 
AlphaGoÈçºÎսʤÈËÀàΧÆå´óʦ:ÖÇÄÜÓ²¼þTensorFlowʵ¼ù ÖÐÎÄpdf¸ßÇå°æ
.NETÐÔÄÜÓÅ»¯ ÖÐÎĸßÇåpdfÍêÕû°æ[183MB]
Éî¶Èѧϰ¼¼ÊõͼÏñ´¦ÀíÈëÃÅ ÖÐÎÄpdfÍêÕû°æ[90MB]

我们需要将编码改为GBK才可以

# -*- coding: utf-8 -*-


import requests
url='https://www.jb51.net/do/book.html'

import re
r=requests.get(url)
r.encoding='GBK'
html=r.text

# html=requests.get(url).text

book_name=re.findall('<h5 class="show-tipinfo"><a href="/books/\d+.html">(.*?)</a></h5>',html,re.S)

for each in book_name:
    print(each)
R语言数据分析项目精解:理论、方法、实战 高清pdf完整版[43MB] 
跟工程师学嵌入式开发:基于STM32和μC OS-Ⅲ 带目录高清版pdf 
人格化电商:网红与IP修炼之道 带目录高清版pdf[35MB] 
第一行代码——以太坊 (李宁著) 高清pdf扫描版[203MB]
Python高性能 (第2版) 中文pdf扫描版[109MB]
Java核心技术及面试指南 完整pdf扫描版[220MB]
MATLAB 2018从入门到精通(实战案例版) 中文pdf高清版[371MB]
程序员修炼之道:程序设计入门30讲 高清pdf完整版[8MB] 
数据可视化与数据挖掘:基于Tableau和SPSS Modeler图形界面 中文高清pdf完整版 
产品经理必懂的技术那点事儿:成为全栈产品经理 中文高清pdf完整版
传智黑马程序员web前端39期全套视频教程(就业班+代码+视频) 完整版
深度学习原理与实践 (陈仲铭等著) 高清pdf完整版[173MB]
Go语言核心编程 (李文塔著) 完整pdf高清版[174MB]
OpenResty完全开发指南:构建百万级别并发的Web应用 中文PDF扫描版[147MB] 
Web全栈工程师的自我修养 中文pdf完整版[15MB] 
HTML5+CSS3从入门到精通 中文pdf完整版[229MB]
数据思维:从数据分析到商业价值 (王汉生) 中文pdf高清版[7MB] 
AlphaGo如何战胜人类围棋大师:智能硬件TensorFlow实践 中文pdf高清版
.NET性能优化 中文高清pdf完整版[183MB]
深度学习技术图像处理入门 中文pdf完整版[90MB]
已标记关键词 清除标记
©️2020 CSDN 皮肤主题: 编程工作室 设计师:CSDN官方博客 返回首页