关于python中.xpath的使用问题
在python中使用xpath定位时,有时候会先用.xpath定位到一个地点,for循环后,继续使用.xpath,但是会出现问题,比如编程客栈在下面这个例子中:
根据xpath定位到了tr,注意游览器自动生成了tbody,在python中要把自动生成的tbody层级去掉。
此时我们想获取tr下面的td,请看代码
import requests from lxml import etree url = "https://www.w3school.com.编程客栈cn/xpath/xpath_axes.asp" res = requests.get(url).text html = etree.HTML(res) a = html.xpath("编程客栈(//table[@class='dataintable'])[1]/tr") print(a) for i in a: s = i.xpath("//td") print(s) print(len(s))
for i in a下,我们想找到的是每个tr下面的td,按理来说只有两个,但是返回的却是全部的44个td,问题出在哪里呢?原来是s = i.xpath("//td")这个写法不对,虽然 i 继承编程客栈了 a 的xpath路径,但是如果写成//td,等于告诉xpath重新搜索www.cppcns.com全部,必须要加上点才可以。s = i.xpath(".//td"),一个点代表当前目录,两个点代表上级目录
这次搜索正常了
总结:除非在一开始的搜索式直接写成 (//table[@class='dataintable'])[1]/tr//td,这样直接搜索td,不用带点,在复用.xpath的时候,必须加上点表明当前目录,否则搜索不到想要的结果
到此这篇关于关于python中.xpath的复用的文章就介绍到这了,更多相关python .xpath复用内容请搜索我们以前的文章或继续浏览下面的相关文章希望大家以后多多支持我们!
精彩评论