爬虫中遇到的问题及解决办法如下:
中文乱码问题:
1 |
import re |
如上代码,加上html.encoding = ‘utf-8’这一句,utf-8是指所爬网页的编码格式。
但是这样可能导致TypeError: object of type ‘Response’ has no len()这个错误。
要解决这个错误就如上代码bsob = BeautifulSoup(html.content,’lxml’)把html改为html.content
爬虫中遇到的问题及解决办法如下:
中文乱码问题:
1 |
import re |
如上代码,加上html.encoding = ‘utf-8’这一句,utf-8是指所爬网页的编码格式。
但是这样可能导致TypeError: object of type ‘Response’ has no len()这个错误。
要解决这个错误就如上代码bsob = BeautifulSoup(html.content,’lxml’)把html改为html.content
近期评论