doc = pq(html) items = doc("#plist .gl-item").items() for item in items: # print(item) strItem = str(item).replace('xmlns', 'xmlns1') item = pq(strItem) priceItems = item.find('.p-price strong i') product = { 'url': item.find('.p-img a').attr("href"), 'image_url': item.find('.p-img a img').attr("src"), 'title': item.find('.p-name a em').text(), 'price':pq(item.find('.p-price strong i')[0]).text() } print(product)
1.用到了for循环,如果有xmlns有时候解析出错,replace下, 然后是如果有2个只用到第一个用[0]重新解析下, 得到内容字符串是text(), 属性是attr里面带.
3633