1. Công cụ này làm gì
Regex cleaner trực tuyến miễn phí này làm sạch hoặc biến đổi văn bản bằng biểu thức chính quy — xóa khớp hoặc thay thế chúng, một hoặc nhiều mẫu liên tiếp. Dùng cho thay thế regex, làm sạch văn bản hoặc tìm và thay thế hàng loạt bằng regex. Không đăng ký, không tải lên; mọi thứ chạy trên trình duyệt. Xâu chuỗi mẫu để đầu ra của mẫu này thành đầu vào của mẫu tiếp theo. Regex không hợp lệ bị bắt với lỗi nội dòng. Lý tưởng cho làm sạch dữ liệu, xóa ký tự, chuẩn hóa, xóa markup hoặc làm sạch CSV.
2. Cách sử dụng
Bắt đầu nhanh: Dán văn bản, thêm mẫu (vd. \s+ cho khoảng trắng), để trống thay thế để xóa hoặc gõ văn bản thay thế, đặt cờ, rồi áp dụng. Thêm mẫu để xâu chuỗi. Mẫu không hợp lệ hiển thị lỗi dưới quy tắc đó.
- Nhập văn bản — Dán hoặc gõ văn bản cần xử lý.
- Thêm mẫu — Gõ biểu thức chính quy (vd.
\d+cho chữ số,\s+cho khoảng trắng). Dùng "Thêm mẫu" để xâu chuỗi nhiều quy tắc. - Thay thế (tùy chọn) — Để trống để xóa khớp, hoặc nhập văn bản thay thế cho mỗi mẫu.
- Đặt cờ — Bật global (g), không phân biệt chữ hoa/thường (i), v.v. Dùng chung cho tất cả mẫu.
- Áp dụng — Nhấp để chạy (hoặc dùng chế độ Live). Kết quả xuất hiện; mẫu không hợp lệ hiển thị lỗi dưới quy tắc lỗi.
3. Cách hoạt động
Mỗi mẫu được xác thực bằng new RegExp() trước khi dùng. Các mẫu được áp dụng tuần tự: đầu ra của quy tắc N thành đầu vào của quy tắc N+1. Nếu mẫu không hợp lệ, chuỗi dừng và hiển thị đầu ra một phần cùng lỗi dưới quy tắc lỗi. Cờ global (g) mặc định nên mọi lần xuất hiện được thay thế trong một lần mỗi quy tắc. Mọi xử lý chạy phía client trên trình duyệt. Không có dữ liệu được gửi lên server.
4. Trường hợp sử dụng & ví dụ
- Làm sạch dữ liệu — Xóa khoảng trắng thừa, xuống dòng hoặc ký tự đặc biệt.
- Trích xuất — Dùng nhóm bắt để trích xuất và thay thế (vd. định dạng lại ngày).
- Chuẩn hóa — Thay thế biến thể (vd. nhiều khoảng trắng → một khoảng trắng).
- Xóa markup — Xóa thẻ HTML hoặc markup khác.
- Làm sạch CSV — Sửa dấu phân cách hoặc chuỗi escape.
Ví dụ
- Mẫu
\s+, thay→ Thu gọn nhiều khoảng trắng thành một. - Mẫu
\d{3}-\d{3}-\d{4}, thay[REDACTED]→ Ẩn số điện thoại. - Mẫu
[^\w\s], thay trống → Xóa tất cả dấu câu.
5. Giới hạn & lưu ý
- Mẫu xác thực trước — Regex không hợp lệ hiển thị lỗi; không thử thay thế.
- ReDoS — Mẫu cực kỳ phức tạp có thể gây thực thi chậm; tránh backtracking thảm họa.
- Chuỗi tuần tự — Nhiều mẫu được áp dụng theo thứ tự; mỗi quy tắc xử lý đầu ra của quy tắc trước.
- Regex JavaScript — Dùng hương vị regex JS; một số tính năng PCRE có thể khác.