爬取某东商品图片_三白草论述

北京荨麻疹防治医院 http://baidianfeng.39.net/bdfby/yqyy/

很早之前写的记录了，仅供交流。

这段时间，因为疫情在家无聊，之前有写过使用requests库，又学了下使用urllib库，在这里记录下学习过程。首先使用的IDE是pycharm，解释器版本3.第一步：分析某东的url，发现某东搜索的url构成规律，输入汉服后开始搜索。点击下一页后，保存相对应的url发现每一页的url不同之处在于其中的page=数字那里，从第二页开始，page=后面的数字以2递增，为一个等差数列。改写page=0,在浏览器中打开后发现是第一页，所以所有的url可以构造为一个列表。第二部，分析html，查找每一个商品图片对应的url检查两三个图片的html元素发现图片url是这样子的，方便好设计正则表达式，因为html中有很多url不是商品图片链接，所以有必要多看几个，当然，大佬就肯定不必了（我是新手哈哈哈））正则表达式：

pat=re.

转载请注明地址:http://www.sanbaicaoasb.com/scls/7515.html

上一篇文章： Excel之VBA常用功能应用篇Exce

下一篇文章：没有了

热点文章

没有热点文章

最新文章

热点文章

推荐文章