开发者

Python操作lxml库实战之Xpath篇

目录
  • ​一、Xpath概述
    • 1、Xpath简介
  • 2、 Xpath的安装
    • 二、Xpath的常用规则
      • 1、路径查找
      • 2、节点查找
      • 3、未知节点
      • 4、获取节点中的文本
      • 5、选取多个路径
    • 总结

      ​一、Xpath概述

      1、Xpath简介

      Xpath(XML Path Language) 是一门在 XML 文档中查找信息的语言,可以用来在XML文档中对元素和属性进行遍历。XPath 用于在 XML 文档中通过元素和属性进行导航。其是一种路径语言(XML Path Language),用来确定XML文档中某部分编程客栈的位置。

      XPath基于XML的树状结构python,提供在数据结构树中找寻节点的能力。起初XPath的提出的初衷是将其作为一个通用的、介于XPointerXSL间的语法模型。但是XPath很快的被开发者采用来当作小型*查询语言被广泛使用。

      2、 Xpath的安装

      Xpath只是 lxml 库中的一个模块,想要使用 Xpath 那么就需要安装 lxml 库

      pip install lxml

      二、Xpath的常用规则

      1、路径查找

      Xpath 的主要语法

      Python操作lxml库实战之Xpath篇

      2、节点查找

      查找节点的一些语法

      Python操作lxml库实战之Xpath篇

      3、未知节点

      当我们匹配时会出现路径不确定的情况,这个时候我们就要涉及到匹配未知节点。匹配未知节点也有对应的语法。

      Python操作lxml库实战之Xpath篇

      4、获取节点中的文本

      通过 属性方法可以获取属性内的内容,但是位于节点之间的内容无法获取到,这个时候就可以通过 text() 与 string() 方法来获得其中的文本。

      通过 text() EnHYO获取某个节点中的文本

      In [1]: page.xpath('//li/a[3]/text()')
      Out[1]: ['霸道总裁爱上我', '斗罗大陆']
      #通过 text() 属性可以很轻松的获取标签之间的文本。

      通过 string() 获取某个节点中的文本

      In [1]:编程客栈 page.xpath('string(//li[1]/a[3])')
      Out[1]: '霸道总裁爱上我'

      5、选取多个路径

      需要同时查找多个条件时可以通过在路径表达式中使用管道符("|"),选取若干个路径

      In [1]: page.xpath('XXXXXXX | XXXXXXXtext()')

      Out[1]: ['']开发者_Go开发

      总结

      到此这篇关于python操作lxml库实战之Xpath篇的文章就介绍到这了,更多相关Python操作lxml库Xpath篇内容请搜索我们以前的python文章或继续浏览下面的相关文章希望大家以后多多支持我们!

      0

      上一篇:

      下一篇:

      精彩评论

      暂无评论...
      验证码 换一张
      取 消

      最新开发

      开发排行榜