爬取某东商品图片

北京荨麻疹防治医院 http://baidianfeng.39.net/bdfby/yqyy/

很早之前写的记录了,仅供交流。

这段时间,因为疫情在家无聊,之前有写过使用requests库,又学了下使用urllib库,在这里记录下学习过程。首先使用的IDE是pycharm,解释器版本3.第一步:分析某东的url,发现某东搜索的url构成规律,输入汉服后开始搜索。点击下一页后,保存相对应的url发现每一页的url不同之处在于其中的page=数字那里,从第二页开始,page=后面的数字以2递增,为一个等差数列。改写page=0,在浏览器中打开后发现是第一页,所以所有的url可以构造为一个列表。第二部,分析html,查找每一个商品图片对应的url检查两三个图片的html元素发现图片url是这样子的,方便好设计正则表达式,因为html中有很多url不是商品图片链接,所以有必要多看几个,当然,大佬就肯定不必了(我是新手哈哈哈))正则表达式:

pat=re.



转载请注明地址:http://www.sanbaicaoasb.com/scls/7515.html
  • 上一篇文章:
  • 下一篇文章: 没有了
  • 热点文章

    • 没有热点文章

    推荐文章

    • 没有推荐文章