某个网址爬出来的网页源代码出现中文乱码
查看源代码可以发现这个网址采用的编码是GBK
# -*- coding: utf-8 -*-
import requests
url='https://www.jb51.net/do/book.html'
import re
# r=requests.get(url)
# r.encoding='GBK'
# html=r.text
html=requests.get(url).text
book_name=re.findall('<h5 class="show-tipinfo"><a href="/books/\d+.html">(.*?)</a></h5>',html,re.S)
for each in book_name:
print(each)
RÓïÑÔÊý¾Ý·ÖÎöÏîÄ¿¾«½â:ÀíÂÛ¡¢·½·¨¡¢ÊµÕ½ ¸ßÇåpdfÍêÕû°æ[43MB]
¸ú¹¤³ÌʦѧǶÈëʽ¿ª·¢:»ùÓÚSTM32ºÍ¦ÌC OS-¢ó ´øÄ¿Â¼¸ßÇå°æpdf
È˸ñ»¯µçÉÌ:ÍøºìÓëIPÐÞÁ¶Ö®µÀ ´øÄ¿Â¼¸ßÇå°æpdf[35MB]
µÚÒ»ÐдúÂ롪¡ªÒÔÌ«·» (ÀîÄþÖø) ¸ßÇåpdfɨÃè°æ[203MB]
Python¸ßÐÔÄÜ (µÚ2°æ) ÖÐÎÄpdfɨÃè°æ[109MB]
JavaºËÐļ¼Êõ¼°ÃæÊÔÖ¸ÄÏ ÍêÕûpdfɨÃè°æ[220MB]
MATLAB 2018´ÓÈëÃŵ½¾«Í¨(ʵս°¸Àý°æ) ÖÐÎÄpdf¸ßÇå°æ[371MB]
³ÌÐòÔ±ÐÞÁ¶Ö®µÀ:³ÌÐòÉè¼ÆÈëÃÅ30½² ¸ßÇåpdfÍêÕû°æ[8MB]
Êý¾Ý¿ÉÊÓ»¯ÓëÊý¾ÝÍÚ¾ò:»ùÓÚTableauºÍSPSS ModelerͼÐνçÃæ ÖÐÎĸßÇåpdfÍêÕû°æ
²úÆ·¾Àí±Ø¶®µÄ¼¼ÊõÄǵãʶù:³ÉΪȫջ²úÆ·¾Àí ÖÐÎĸßÇåpdfÍêÕû°æ
´«ÖǺÚÂí³ÌÐòÔ±webǰ¶Ë39ÆÚÈ«Ì×ÊÓÆµ½Ì³Ì(¾ÍÒµ°à+´úÂë+ÊÓÆµ) ÍêÕû°æ
Éî¶ÈѧϰÔÀíÓëʵ¼ù (³ÂÖÙÃúµÈÖø) ¸ßÇåpdfÍêÕû°æ[173MB]
GoÓïÑÔºËÐıà³Ì (ÀîÎÄËþÖø) ÍêÕûpdf¸ßÇå°æ[174MB]
OpenRestyÍêÈ«¿ª·¢Ö¸ÄÏ:¹¹½¨°ÙÍò¼¶±ð²¢·¢µÄWebÓ¦Óà ÖÐÎÄPDFɨÃè°æ[147MB]
Webȫջ¹¤³ÌʦµÄ×ÔÎÒÐÞÑø ÖÐÎÄpdfÍêÕû°æ[15MB]
HTML5+CSS3´ÓÈëÃŵ½¾«Í¨ ÖÐÎÄpdfÍêÕû°æ[229MB]
Êý¾Ý˼ά:´ÓÊý¾Ý·ÖÎöµ½ÉÌÒµ¼ÛÖµ (ÍõººÉú) ÖÐÎÄpdf¸ßÇå°æ[7MB]
AlphaGoÈçºÎսʤÈËÀàΧÆå´óʦ:ÖÇÄÜÓ²¼þTensorFlowʵ¼ù ÖÐÎÄpdf¸ßÇå°æ
.NETÐÔÄÜÓÅ»¯ ÖÐÎĸßÇåpdfÍêÕû°æ[183MB]
Éî¶Èѧϰ¼¼ÊõͼÏñ´¦ÀíÈëÃÅ ÖÐÎÄpdfÍêÕû°æ[90MB]
我们需要将编码改为GBK才可以
# -*- coding: utf-8 -*-
import requests
url='https://www.jb51.net/do/book.html'
import re
r=requests.get(url)
r.encoding='GBK'
html=r.text
# html=requests.get(url).text
book_name=re.findall('<h5 class="show-tipinfo"><a href="/books/\d+.html">(.*?)</a></h5>',html,re.S)
for each in book_name:
print(each)
R语言数据分析项目精解:理论、方法、实战 高清pdf完整版[43MB]
跟工程师学嵌入式开发:基于STM32和μC OS-Ⅲ 带目录高清版pdf
人格化电商:网红与IP修炼之道 带目录高清版pdf[35MB]
第一行代码——以太坊 (李宁著) 高清pdf扫描版[203MB]
Python高性能 (第2版) 中文pdf扫描版[109MB]
Java核心技术及面试指南 完整pdf扫描版[220MB]
MATLAB 2018从入门到精通(实战案例版) 中文pdf高清版[371MB]
程序员修炼之道:程序设计入门30讲 高清pdf完整版[8MB]
数据可视化与数据挖掘:基于Tableau和SPSS Modeler图形界面 中文高清pdf完整版
产品经理必懂的技术那点事儿:成为全栈产品经理 中文高清pdf完整版
传智黑马程序员web前端39期全套视频教程(就业班+代码+视频) 完整版
深度学习原理与实践 (陈仲铭等著) 高清pdf完整版[173MB]
Go语言核心编程 (李文塔著) 完整pdf高清版[174MB]
OpenResty完全开发指南:构建百万级别并发的Web应用 中文PDF扫描版[147MB]
Web全栈工程师的自我修养 中文pdf完整版[15MB]
HTML5+CSS3从入门到精通 中文pdf完整版[229MB]
数据思维:从数据分析到商业价值 (王汉生) 中文pdf高清版[7MB]
AlphaGo如何战胜人类围棋大师:智能硬件TensorFlow实践 中文pdf高清版
.NET性能优化 中文高清pdf完整版[183MB]
深度学习技术图像处理入门 中文pdf完整版[90MB]