このツールの機能
正規表現クリーナーは、正規表現を使ってテキストを削除または置換します。1つ以上のパターンを入力;各パターンは順番に適用(パターン1の出力がパターン2の入力に)。一致を削除するかカスタムテキストで置換するか選択。適用前に各パターンを検証;無効な正規表現は失敗したルールの下にインラインエラーを表示。データのクリーニング、不要文字の除去、一括テキスト変換に便利です。
使い方
- テキストを入力 — 処理するテキストを貼り付けまたは入力。
- パターンを追加 — 正規表現を入力(例:
\d+で数字、\s+で空白)。「パターンを追加」で複数ルールをチェーン。 - 置換(オプション) — 空のままなら一致を削除、各パターンごとに置換テキストを入力。
- フラグを設定 — グローバル(g)、大文字小文字無視(i)など。全パターンで共通。
- 適用 — クリックして実行(またはLiveモード使用)。無効なパターンは失敗したルールの下にエラーを表示。
動作の仕組み
各パターンは使用前に new RegExp() で検証。パターンは順次適用:ルールNの出力がルールN+1の入力に。パターンが無効な場合、チェーンは停止し部分出力と失敗したルールの下にエラーを表示。すべての処理はクライアント側。
すべての計算はブラウザ内で実行されます。データはサーバーに送信されません。
使用例とサンプル
- データクリーニング — 余分な空白、改行、特殊文字を削除。
- 抽出 — キャプチャグループで抽出して置換(例:日付の reformat)。
- 正規化 — バリアントを置換(例:複数スペース→単一スペース)。
- マークアップ除去 — HTMLタグやその他のマークアップを削除。
- CSVクリーニング — 区切り文字やエスケープシーケンスを修正。
例
- パターン
\s+、置換→ 複数スペースを1つにまとめる。 - パターン
\d{3}-\d{3}-\d{4}、置換[REDACTED]→ 電話番号を隠す。 - パターン
[^\w\s]、置換空 → すべての句読点を除去。
制限と既知の制約
- パターンは先に検証 — 無効な正規表現はエラーを表示;置換は試行されない。
- ReDoS — 非常に複雑なパターンは遅い実行の原因になる場合あり;破滅的バックトラッキングを避けること。
- 順次チェーン — 複数パターンは順番に適用;各ルールは前のルールの出力を処理。
- JavaScript正規表現 — JS正規表現フレーバーを使用;一部のPCRE機能は異なる場合あり。