Блог

Регулярные Выражения. Metacharacters (Метасимволы)

Более подробно эта тема рассматривается в курсе Python Fundamentals

В предыдущих примерах мы уже познакомились с несколькими метасимволами (то есть символами, объединяющими определённую группу символов). Теперь самое время свести их в одну таблицу и заодно рассказать о тех, которые нам ещё не встречались.

Symbols Their meaning:
. (dot) Any character except \n
\d Any digit
\w Any word character: [A-Za-z0-9_]
\s Any whitespace characters: [ \n\r\t\f]
\D Any NON-digit
\W Any NON-word character: [A-Za-z0-9_]
\S Any NON-whitespace characters: [ \n\r\t\f]

  • . (dot) - точка в регулярных выражениях означает совсем не точку, а вообще любой символ (чтобы ввести именно точку, необходимо перед самой точкой поставить символ экранирования бэклсеш, то есть сделать вот так: \.) ;
  • \d - означает любой цифровой символ (аналог [0-9]) ;
  • \w - любой символ слова, т.е. большие и маленькие буквы, цифры и знак подчёркивания [A-Za-z0-9_] ;
  • \s - любой пробельный символ (перевод строки, знак табуляции и т.д.) [ \n\r\t\f] ;
  • \D - большие буквы означают инверсию. Поэтому, если \d означает любой ЦИФРОВОЙ символ, то \D будет означать любой НЕ цифровой символ ;
  • \W - любой НЕ символ слова (т.е. все символы, кроме [A-Za-z0-9_] ;
  • \S - любой НЕ пробельный символ ;

<<< Назад к началу статьи "Регулярные Выражения. Предисловие"