正则表达式学习 --- 01

摘要

本文主要介绍了什么是正则表达式、如何去学习正则,然后简单介绍了元字符的种类。

目录

1.正则表达式

1.1 正则的定义

正则,就是正则表达式,英文是 Regular Expression,简称 RE。顾名思义,正则其实就是一种描述文本内容组成规律的表示方式

在编程语言中,正则常常用来简化文本处理的逻辑;在 Linux 命令中,可以帮助我们轻松地查找或编辑文件的内容

1.2正则的功能

  1. 校验数据的有效性,比如验证手机号的位数以及无效的场景;
  2. 查找符合要求的文本,比如查找符合某些要求的手机号;
  3. 对文本进行切割、替换等操作,比如替换一段文本中同一个单词。

2.正则的学习

2.1 使用正则

  1. 分解问题:拿到问题后考虑分解成子问题以及每个子问题是否独立;
  2. 分析子问题:分析每个子问题的解决逻辑;
  3. 应用正则表示:使用正则表达式解释每个子问题的逻辑;
  4. 调试。

2.2 注意事项

  1. 能用普通字符串处理的,坚决⽤普通字符串处理。
  2. 能写注释的正则表达式,⼀定要写注释。
  3. 能用多个简单正则表达式解决的,⼀定不要苛求用一个复杂的正则表达式。

3. 元字符

元字符就是指那些在正则表达式中具有特殊意义的专用字符

3.1 元字符的种类及含义

  1. 特殊单字符
    • .表示任意字符(换行除外)
    • \d表示任意单个数字 ,\D任意非数字
    • \w表示任意单个数字或字母或下划线 ,\W表示非数字、字母、下划线
    • \s表示任意单个空白符,\S表示任意非空白符
  2. 空白符
    • \r 回车符
    • \n 换行符
    • \f 换页符
    • \t 制表符(TAB)
    • \v 垂直制表符
    • \s 任意空白符
  3. 范围
    • | 或,a b 表示 a 或 b
    • [...] 多选一,括号中的任意单个字符
    • [a-z] a 到 z 中的任意一个字符
    • [^...] 不包含括号中的任意一个字符
  4. 量词
    • * 表示 0 到多次
    • + 表示 1 到多次
    • ? 表示 0 到 1 次(可以表示是否存在)
    • {m} 表示出现 m 次
    • {m,} 表示至少出现 m 次
    • {m,n} 表示出现 m 到 n 次
  5. 断言

版权声明

本文原创作者:ereson
博客地址 :https://ereson.github.io/

Written on November 21, 2021