新Linux入門｜正規表現を理解しよう！文字列パターンとメタキャラクタの基本

　Linuxでテキストを扱う際、「特定の文字列を探したい」「条件に合う行だけ抽出したい」といった場面はよくあります。
そんなときに大活躍するのが 正規表現（Regular Expression） です。

正規表現とは、文字列のパターン（規則）を表現するための特別な記法のことで、
grepやsed、awkなどのコマンドで頻繁に使われます。
ファイルの検索、ログの分析、テキスト置換など、システム管理者にとって欠かせない知識です。

　ここでは、正規表現の基本的な考え方と、よく使われるメタキャラクタ（特殊記号）についてわかりやすく解説します。

正規表現（Regular Expression）は、
「あるルールに合った文字列」を柔軟に検索・抽出するためのパターン表現です。

例えば、次のような用途で使われます。

💬 正規表現を理解しておくと、grepコマンド一つで強力な検索が可能になります。

正規表現には、特別な意味を持つ文字（メタキャラクタ）がいくつかあります。
これらを組み合わせることで、複雑なパターンを表現できます。

メタキャラクタ	説明
.	任意の1文字にマッチする。
*	直前のパターンが0回以上繰り返すものにマッチ。
+	直前のパターンが1回以上繰り返すものにマッチ（拡張正規表現）。
?	直前のパターンが0回または1回現れるものにマッチ（拡張正規表現）。
^	行の先頭にマッチする。
$	行の末尾にマッチする。
[]	角括弧内のいずれか1文字にマッチする。例：[abc] は a, b, c のいずれか。
()	グループ化を行う。繰り返しや参照に使うことができる。
\	エスケープ文字。特殊文字を通常の文字として扱う。

💡 + と ? は 拡張正規表現 なので、grep で使う際は -E オプション を付ける必要があります。
（例：grep -E "a+b"）

💬 たとえば grep "^[A-Z]" とすれば、行の先頭が大文字で始まる行を簡単に抽出できます。

grep は正規表現を利用できる代表的なコマンドです。

[suzuki@AlmaLinux ~]$sudo grep "error" /var/log/messages
Oct 27 10:35:12 AlmaLinux systemd[1]: error: failed to start service.

[suzuki@AlmaLinux ~]$ grep -E "a+" sample.txt
aaaaa
banana

[suzuki@AlmaLinux ~]$ grep "\.txt$" filelist.txt
report.txt
memo.txt

💬 \. はドットをそのまま「.」として扱うためにエスケープしています。

正規表現とよく混同されるのが、シェルのワイルドカード（メタキャラクタ）です。
実際には用途も挙動も異なります。

💬 たとえばシェルの ls *.txt は「.txtで終わるファイル名」を探しますが、
正規表現の \.txt$ は「行末が .txt で終わる文字列」を探す違いがあります。

✅ まとめ

💬 正規表現をマスターすれば、ログ解析やテキスト処理がグッと効率的になります。
次にgrepコマンドなどで実際にパターンマッチングを体験してみましょう！