正则表达式
正则表达式¶
概念¶
正则表达式是一种用来匹配字符串的强有力的武器。它的设计思想是用一种描述性的语言来给字符串定义一个规则,凡是符合规则的字符串,我们就认为它“匹配”了,否则,该字符串就是不合法的
模式¶
模式
描述
^
匹配字符串的开头
$
匹配字符串的末尾
.
匹配任意字符
\
是之后的表示式失效, 仅匹配其字面字符
[...]
用来表示一组字符, 单独列出[amk] 匹配 ‘a’, ‘m’ 或 ‘k’
[^...]
匹配不在[]中的字符
[...-...]
匹配一个范围(如果想匹配一个-, 则可以将其放在括号开头或结尾)
*
匹配 0 个或多个表达式
+
匹配 1 个或多个表达式
?
匹配 0 个或 1 个表达式, 非贪婪方式
{n}
精确匹配 n 个表达式
{n, m}
匹配 n 到 m 次表达式, 贪婪方式( 若无 m, 如{n,}, 则匹配 n 到无穷多个表达式)
`a
b`
(...)
对正则表达式分组并记住匹配的文本
(?imx...)
正则 ...
基本语法
基础语法¶
编码¶
默认情况都采用UTF-8编码, 当然也可以为源码文件制定不同的编码
1# -*- coding: cp-1252 -*-
输入/输出¶
print() 函数可接受多个字符串, 用“,”隔开, 或用“+”连接字符串; 同时它也可以打印整数或计算结果, 同时它可以接受参数 end来指定以什么字符结尾
, 隔开: 会在输出中原本“,”的地方补一个空格
+ 连接: 不会在“+”的地方补空格
input() 函数可以让用户输入字符串, 并存放在一个变量里, 同时它可以接受一个参数用于提示用户输入, 例:
12neme = input('Please enter your name:')print('hello,', name)
注释与缩进¶
单行注释: 以 # 开头的语句是注释
多行注释: 用 '''或 """括住的部分属于多行注释, 一般位于文件, 类, 函数开头的多行注释会被解释为 DocString
缩进: PEP8 规定的缩进为4个空格
注: 当然可以使用任意个数的空格 ...
Python解释器
Python解释器¶
CPython: 官方开发的 Python 解释器, 使用 C语言 开发
IPython: 基于 CPython 解释器开发的, 在交互方式上有所增强(CPython用 >>> 作为提示符, 而IPython用 In [序号]: 作为提示符)
PyPy: 采用 JIT技术, 对 Python 代码进行 动态编译 (不是解释), 所以可以显著提高Python代码的执行速度
Jython: 运行在 Java 平台上的Python解释器,可以直接把 Python 代码编译成 Java 字节码执行
IronPython: 运行在微软 .NET 平台上的Python解释器, 可以直接把 Python 代码编译成 .NET 的字节码