Công cụ này làm gì
Regex Cleaner xóa hoặc thay thế văn bản bằng biểu thức chính quy. Nhập một hoặc nhiều mẫu regex; mỗi mẫu được áp dụng theo thứ tự (kết quả mẫu 1 là đầu vào cho mẫu 2). Chọn xóa khớp hoặc thay thế bằng văn bản tùy chỉnh. Xác thực từng mẫu trước khi áp dụng; regex không hợp lệ hiển thị lỗi dưới mẫu lỗi. Mặc định cờ global để tất cả khớp được xử lý. Hữu ích cho làm sạch dữ liệu, loại bỏ ký tự không mong muốn hoặc chuyển đổi văn bản hàng loạt.
Cách sử dụng
- Nhập văn bản — Dán hoặc gõ văn bản cần xử lý.
- Thêm mẫu — Gõ biểu thức chính quy (ví dụ
\d+cho chữ số,\s+cho khoảng trắng). Dùng "Thêm mẫu" để xâu chuỗi nhiều quy tắc. - Thay thế (tùy chọn) — Để trống để xóa khớp, hoặc nhập văn bản thay thế cho mỗi mẫu.
- Đặt cờ — Bật global (g), không phân biệt chữ hoa/thường (i), v.v. Dùng chung cho tất cả mẫu.
- Áp dụng — Nhấp để chạy (hoặc dùng chế độ Live). Kết quả hiển thị; mẫu không hợp lệ hiển thị lỗi dưới quy tắc lỗi.
Cách hoạt động
Mỗi mẫu được xác thực bằng new RegExp() trước khi dùng. Các mẫu được áp dụng tuần tự: kết quả quy tắc N là đầu vào cho quy tắc N+1. Nếu mẫu không hợp lệ, chuỗi dừng và hiển thị kết quả một phần cùng lỗi dưới quy tắc lỗi. Cờ global (g) là mặc định. Tất cả xử lý chạy phía máy khách.
Tất cả tính toán và xử lý chạy hoàn toàn trên trình duyệt của bạn. Không có dữ liệu được gửi đến máy chủ.
Trường hợp sử dụng & ví dụ
- Làm sạch dữ liệu — Xóa khoảng trắng thừa, xuống dòng hoặc ký tự đặc biệt.
- Trích xuất — Dùng nhóm bắt để trích xuất và thay thế (ví dụ định dạng lại ngày).
- Chuẩn hóa — Thay thế biến thể (ví dụ nhiều khoảng trắng → một khoảng trắng).
- Loại markup — Xóa thẻ HTML hoặc markup khác.
- Làm sạch CSV — Sửa dấu phân cách hoặc chuỗi escape.
Ví dụ
- Mẫu
\s+, thay→ Thu gọn nhiều khoảng trắng thành một. - Mẫu
\d{3}-\d{3}-\d{4}, thay[REDACTED]→ Ẩn số điện thoại. - Mẫu
[^\w\s], thay trống → Xóa tất cả dấu câu.
Giới hạn & lưu ý
- Mẫu xác thực trước — Regex không hợp lệ hiển thị lỗi; không thử thay thế.
- ReDoS — Mẫu cực kỳ phức tạp có thể gây thực thi chậm; tránh backtracking thảm họa.
- Chuỗi tuần tự — Nhiều mẫu được áp dụng theo thứ tự; mỗi quy tắc xử lý kết quả của quy tắc trước.
- Regex JavaScript — Dùng hương vị regex JS; một số tính năng PCRE có thể khác.