python爬取图片

关于Python的爬取网站图片示例，基于Python 2.X

完整代码


## -*- coding: UTF-8 -*-

import sys  
reload(sys)  
sys.setdefaultencoding('utf8')  

import urllib
import re
import os
import time


class :
	def __init__(self,url,position,regX):
		self.url = url
		self.position = position
		self.regX = regX

	def save_page_info(self):

		html = urllib.urlopen(self.url).read()

		print html

		pic_url = re.findall(self.regX,html,re.S)

		i = 0
		for item in pic_url:
			pic = urllib.urlopen(item)

			print item
			# 文件夹不存在则创建
			if not os.path.isdir(self.position):
				os.makedirs(self.position)
			fp = open(self.position+str(i)+'.jpg','wb')
			fp.write(pic.read())
			fp.close()
			time.sleep(0.5)
			i+=1

url = 'http://www.umei.cc/meinvtupian/' 
position = '/Users/mengfanxu/self/python/images/' 
regX = r'<img src="(.+?.jpg)" '  

spider = Spider(url,position,regX)
spider.save_page_info()

python爬取图片

近期文章

近期评论

标签

热门

文章归档

分类目录

功能