Dán hoặc nhập văn bản vào ô nhập để lập tức xem mười chỉ số viết lách: số từ, số ký tự, từ không trùng, số câu, số đoạn văn, số dòng, byte, thời gian đọc ước tính, thời gian nói ước tính và bảng tần suất từ khóa hiển thị mười từ được dùng nhiều nhất. Không cần nhấn nút. Không cần đăng nhập. Văn bản của bạn không rời khỏi trình duyệt.
Công cụ này đo những gì
- Từ: Mỗi chuỗi chữ cái hoặc chữ số liên tiếp được phân tách bằng khoảng trắng tính là một từ. Từ viết tắt (don’t), từ ghép nối (well-known) và số (42) đều được tính là một từ.
- Từ không trùng: Số lượng từ khác biệt sau khi chuyển tất cả về chữ thường. Mật độ từ vựng 55–70% là mức điển hình cho nội dung web dễ đọc.
- Ký tự: Tổng số ký tự bao gồm khoảng trắng và dấu câu — mỗi điểm mã Unicode tính là một ký tự.
- Ký tự không tính khoảng trắng: Số ký tự sau khi loại bỏ toàn bộ khoảng trắng. Dùng khi nền tảng áp đặt giới hạn trên ký tự hiển thị.
- Câu: Các đoạn văn kết thúc bằng dấu
.,!, hoặc?(và tương đương trong tiếng Trung, Nhật, Hàn). Chữ viết tắt và dấu chấm lửng có thể ảnh hưởng nhẹ đến kết quả. - Đoạn văn: Các khối văn bản được phân cách bởi một hoặc nhiều dòng trống.
- Dòng: Các dấu ngắt dòng cứng. Quan trọng với code, thơ, kịch bản và dữ liệu CSV.
- Byte: Kích thước mã hóa UTF-8. Cần thiết với payload API, giới hạn cột cơ sở dữ liệu, tiêu đề HTTP và tin nhắn SMS.
- Thời gian đọc: Ước tính theo 200 từ/phút — tốc độ đọc thầm trung bình của người lớn bản ngữ.
- Thời gian nói: Ước tính theo 130 từ/phút — nhịp diễn đạt thoải mái cho thuyết trình và podcast.
Cách sử dụng
- Dán hoặc nhập văn bản vào ô nhập — mười chỉ số cập nhật ngay lập tức khi bạn gõ.
- Dùng nút Tải lên để đọc nội dung từ file
.txttrực tiếp trên máy. - Dùng nút Xóa để làm trống và bắt đầu lại từ đầu.
- Xem bảng Từ phổ biến nhất bên dưới phần thống kê để biết từ nào xuất hiện nhiều nhất và tỷ lệ của chúng trong toàn bộ văn bản.
- Điền sẵn nội dung từ công cụ hoặc CMS bên ngoài bằng cách thêm
?input=nội_dungvào URL trang.
Số từ theo loại nội dung
Mỗi định dạng viết có chuẩn độ dài riêng. Bảng dưới đây là tài liệu tham khảo nhanh khi bạn đang viết theo mục tiêu hoặc kiểm tra số từ.
| Loại nội dung | Độ dài thông thường | Ghi chú |
|---|---|---|
| Tweet / Bài đăng X | Tối đa 280 ký tự | Giới hạn theo ký tự, không phải từ |
| Mô tả meta Google | 155–160 ký tự | Quá 160 ký tự sẽ bị cắt |
| Bản tin email | 200–500 từ | Email ngắn có tỷ lệ tương tác cao hơn |
| Thư xin việc | 250–400 từ | Một trang súc tích |
| Bài luận đại học (Common App) | 250–650 từ | Giới hạn cứng được áp dụng |
| Bài blog | 1.500–2.500 từ | Nội dung thông tin tiêu chuẩn |
| Bài SEO dạng dài | 2.500–4.000 từ | Tương quan với thứ hạng cạnh tranh |
| Truyện ngắn | 1.000–7.500 từ | |
| Tiểu thuyết vừa | 20.000–40.000 từ | |
| Tiểu thuyết | 70.000–100.000 từ | Dao động nhiều theo thể loại |
| Luận văn thạc sĩ | 15.000–25.000 từ | Tùy theo quy định từng trường |
Giới hạn ký tự theo nền tảng
Khi chuẩn bị nội dung cho các nền tảng kỹ thuật số, số ký tự thường quan trọng hơn số từ. Đây là giới hạn cứng năm 2026 của các đích xuất bản phổ biến nhất.
| Nền tảng / Trường | Giới hạn |
|---|---|
| Twitter / X post | 280 ký tự |
| Twitter / X bio | 160 ký tự |
| Tiêu đề tìm kiếm Google | 50–60 ký tự |
| Mô tả meta Google | 155–160 ký tự |
| Tiêu đề Google Ads | 30 ký tự mỗi tiêu đề |
| Mô tả Google Ads | 90 ký tự mỗi dòng |
| Tiêu đề quảng cáo Facebook | 27 ký tự |
| Caption Instagram | 2.200 ký tự |
| Bio Instagram | 150 ký tự |
| Bài đăng LinkedIn | 3.000 ký tự |
| Tiêu đề LinkedIn | 220 ký tự |
| Tiêu đề YouTube | 70 ký tự |
| Caption TikTok | 2.200 ký tự |
| SMS (mã hóa GSM-7) | 160 ký tự mỗi đoạn |
Từ không trùng và mật độ từ vựng
Chỉ số Từ không trùng đếm số lượng từ khác biệt trong văn bản sau khi chuẩn hóa về chữ thường. Nếu bài viết 1.000 từ của bạn dùng 620 từ khác nhau, mật độ từ vựng là 62%.
Ý nghĩa với chất lượng bài viết: Mật độ cao (trên 60–65%) cho thấy văn xuôi phong phú và cuốn hút. Mật độ thấp (dưới 40%) thường báo hiệu lặp từ nhiều, câu thừa hoặc nhồi nhét từ khóa. Văn học nghệ thuật thường đạt trên 70%, trong khi văn phong hội thoại có thể chỉ đạt 45–55% theo chủ đích.
Ý nghĩa với SEO: Nếu bài viết 2.000 từ chỉ có 400 từ không trùng (20%), một số ít từ có thể xuất hiện hàng chục lần — đây là mẫu mà công cụ tìm kiếm liên kết với việc tối ưu hóa thao túng. Dùng bảng Từ phổ biến nhất cùng với chỉ số từ không trùng: nếu từ khóa mục tiêu nằm trong ba từ xuất hiện nhiều nhất của một bài ngắn, đó là tín hiệu cụ thể để đa dạng hóa ngôn ngữ.
Ý nghĩa với học thuật: Các công cụ phát hiện đạo văn và phân loại nội dung AI đánh dấu mật độ từ vựng bất thường thấp là dấu hiệu của việc xoay vòng văn bản hoặc diễn giải bằng AI. Văn bản do con người viết thực sự trong một lĩnh vực chủ đề nhất định luôn duy trì sự đa dạng từ vựng nhất quán.
Thời gian đọc và thời gian nói
Thời gian đọc được tính ở mức 200 từ/phút — mức trung bình chuẩn cho người lớn đọc thầm tiếng Anh. Thời gian nói dùng 130 từ/phút, phản ánh nhịp trình bày tự nhiên và không vội vã.
Cả hai đều là ước tính. Tốc độ đọc thực tế dao động từ 150 đến 250 từ/phút với văn xuôi thông thường. Tốc độ nói của người dẫn chương trình và diễn giả có kinh nghiệm là 130–160 từ/phút, trong đó 130 từ/phút để lại đủ chỗ cho ngừng nghỉ và nhấn mạnh.
Bảng quy đổi từ sang thời gian:
| Thời lượng | Nói (130 từ/phút) | Đọc (200 từ/phút) |
|---|---|---|
| 1 phút | ~130 từ | ~200 từ |
| 2 phút | ~260 từ | ~400 từ |
| 5 phút | ~650 từ | ~1.000 từ |
| 10 phút | ~1.300 từ | ~2.000 từ |
| 15 phút | ~1.950 từ | ~3.000 từ |
| 20 phút (TED talk) | ~2.600 từ | ~4.000 từ |
| 30 phút | ~3.900 từ | ~6.000 từ |
| 45 phút | ~5.850 từ | ~9.000 từ |
| 60 phút | ~7.800 từ | ~12.000 từ |
Với kịch bản podcast, 130 từ/phút là mức nền tin cậy; hầu hết người dẫn dao động từ 120–160 từ/phút. Với video YouTube, hãy lên kế hoạch 120–140 từ/phút để có chỗ cho ngừng nghỉ, khoảnh khắc hình ảnh và nhịp nói tự nhiên.
Từ phổ biến nhất: Bảng tần suất từ khóa
Bảng Từ phổ biến nhất hiển thị mười từ xuất hiện nhiều nhất trong văn bản, kèm số lần xuất hiện và tỷ lệ phần trăm trên tổng số từ. Bảng tự động hiện ra ngay khi văn bản có nội dung và cập nhật theo thời gian thực.
Với người viết nội dung SEO: Dán bản nháp bài viết và kiểm tra xem từ khóa chính có nằm trong phạm vi mong đợi không. Từ khóa mục tiêu xuất hiện ở mức 1–2% tổng số từ là tần suất tự nhiên và an toàn. Nếu bảng cho thấy một từ khóa đạt 4–5%+ trong bài ngắn, sự dư thừa hiện ra ngay lập tức — không cần quét thủ công toàn bộ bài.
Với chất lượng viết nói chung: Văn xuôi lặp lại thường xuất phát từ những từ thói quen vô thức — rất, thực sự, chỉ, mà, thứ. Nếu bảng tần suất cho thấy “chỉ” xuất hiện 14 lần trong email 300 từ, bạn có tín hiệu cụ thể và có thể hành động ngay để chỉnh sửa trước khi gửi.
Lưu ý về stop word: Bảng hiển thị tất cả các từ bao gồm cả từ chức năng phổ biến (the, a, is, và). Đây là chủ đích — trong phân tích nội dung, việc xác nhận rằng “the” đứng đầu danh sách tần suất (chứ không phải một từ khóa ngoài ý muốn) là thông tin hữu ích.
Đếm byte: Chỉ số dành cho lập trình viên
Chỉ số Byte hiển thị kích thước văn bản được mã hóa UTF-8. Với tiếng Anh thuần túy, byte bằng ký tự — mỗi ký tự ASCII dùng đúng một byte. Hai chỉ số này phân kỳ với văn bản không phải ASCII:
- Ký tự ASCII (a–z, 0–9, dấu câu chuẩn) → 1 byte
- Ký tự Latin mở rộng (é, ñ, ü) → 2 byte
- Ký tự CJK (Trung, Nhật, Hàn) → 3 byte
- Hầu hết emoji → 4 byte
Khi nào byte count quan trọng:
- SMS: Mã hóa GSM-7 tiêu chuẩn cho phép 160 ký tự mỗi đoạn tin. Chuyển sang Unicode (bắt buộc với emoji hoặc ký tự không phải Latin) giảm giới hạn xuống còn 70 ký tự mỗi đoạn. Một emoji đơn lẻ có thể đẩy tin nhắn 160 ký tự thành tin nhắn nhiều đoạn.
- Cột cơ sở dữ liệu: MySQL
VARCHAR(255)lưu 255 byte, không phải 255 ký tự. Chuỗi 100 ký tự tiếng Trung dùng 300 byte và vượt giới hạn cột. PostgreSQLVARCHAR(n)giới hạn theo số ký tự, không phải byte — biết bạn đang làm việc với cái nào giúp tránh việc cắt ngầm. - Payload API: Nhiều API áp đặt giới hạn kích thước body theo byte (thường là 256 KB, 1 MB hoặc 10 MB). Byte count quyết định payload có thể gửi trong một request hay không.
- Lưu trữ trình duyệt:
localStoragevàsessionStoragecó hạn mức dựa trên byte từ 5–10 MB mỗi origin. KhóalocalStoragelưu tài liệu lớn sẽ đạt giới hạn nhanh hơn so với số ký tự gợi ý.
Văn bản của bạn không rời khỏi trình duyệt
Công cụ đếm từ thường xử lý nội dung nhạy cảm — bản thảo pháp lý, ghi chú y tế, bản thảo chưa xuất bản, tài liệu kinh doanh độc quyền. Gửi văn bản đó lên máy chủ bên thứ ba để xử lý là rủi ro không cần thiết.
Tại UPREK, cách tiếp cận của chúng tôi đơn giản: toàn bộ quá trình tính toán chạy trong trình duyệt của bạn bằng JavaScript thuần — không có round-trip đến máy chủ, không có ping analytics gắn với bản nháp, không có dịch vụ bên thứ ba nào chạm vào văn bản của bạn.
- Xử lý 100% cục bộ: Đếm từ, đếm ký tự, tính byte, phân tích từ không trùng và tần suất từ khóa đều chạy trong JavaScript engine của trình duyệt bằng API tích hợp sẵn
String.match(),Set,ArrayvàTextEncoder. Không có thư viện ngoài hay lệnh gọi từ xa nào liên quan. - Không tải lên máy chủ: Văn bản của bạn không bao giờ được truyền đến máy chủ của chúng tôi — dù khi dán, khi tải file hay khi nhấn phím bất kỳ.
- Không ghi log hay lưu trữ: Chúng tôi không ghi lại, lưu trữ hay cache bất kỳ nội dung nào bạn nhập hoặc tải lên công cụ này.
- Xóa tức thì: Văn bản chỉ tồn tại trong bộ nhớ hoạt động của tab trình duyệt. Đóng tab là mất hết.
- Có thể kiểm chứng: Mở công cụ nhà phát triển của trình duyệt, chuyển sang tab Mạng và bắt đầu nhập. Bạn sẽ thấy không có yêu cầu mạng ra ngoài nào được kích hoạt bởi công cụ đếm từ.
Điền sẵn nội dung qua tham số URL
Bạn có thể nạp trước văn bản vào ô nhập bằng tham số ?input=:
https://www.uprek.com/vi/tools/cong-cu-dem-tu?input=xin%20chao
Tính năng này hữu ích cho quy trình nội bộ — ví dụ, một nút trong CMS mở công cụ này với bản nháp đã được tải sẵn để kiểm tra độ dài trước khi xuất bản. Tránh nhúng văn bản nhạy cảm vào URL vì URL được lưu trong lịch sử trình duyệt và có thể xuất hiện trong log máy chủ hoặc proxy.
Câu hỏi thường gặp
Cái gì được tính là một từ — số và từ ghép có được tính không?
Có, cả hai đều được tính. Công cụ này dùng mẫu từ nhận biết Unicode khớp với mọi chuỗi chữ cái hoặc chữ số liên tiếp. Số như 42 tính là một từ, từ viết tắt như don't tính là một từ, và từ ghép nối như well-known cũng tính là một từ. Mẫu này áp dụng đúng cho cả chữ viết không phải Latin — tiếng Ả Rập, Devanagari, Cyrillic và các ngôn ngữ khác đều được xử lý chính xác.
Công cụ này chính xác đến đâu so với Microsoft Word hay Google Docs?
Rất gần nhau với văn xuôi thông thường, có thể có sai lệch nhỏ ở các trường hợp đặc biệt. Trình xử lý văn bản áp dụng quy tắc riêng cho URL, địa chỉ email và một số mẫu dấu câu. Với viết lách hằng ngày, các con số khớp gần nhau. Với bài nộp học thuật có giới hạn từ nghiêm ngặt, hãy luôn kiểm tra lại số từ cuối cùng trong phần mềm mà tổ chức của bạn yêu cầu.
Thời gian đọc được tính như thế nào?
Thời gian đọc ước tính ở mức 200 từ/phút — mức trung bình được trích dẫn rộng rãi cho người lớn đọc thầm tiếng Anh. Tốc độ thực tế của từng người thay đổi tùy theo độ phức tạp của văn bản, mức độ quen thuộc với chủ đề và khả năng đọc cá nhân. Người đọc thành thạo thường đạt 150–250 từ/phút với văn xuôi thông thường. Đây là ước tính, không phải đảm bảo.
Bài phát biểu 5 phút cần bao nhiêu từ?
Với tốc độ nói thoải mái 130 từ/phút, bài phát biểu 5 phút cần khoảng 650 từ. Với tốc độ nhanh hơn là 150 từ/phút, 5 phút tương đương khoảng 750 từ. Với bài thuyết trình 10 phút, hãy chuẩn bị 1.300 từ ở mức 130 từ/phút. Với bài nói 20 phút (độ dài TED), hãy lên kế hoạch khoảng 2.600 từ. Thời gian nói hiển thị trong công cụ này dùng 130 từ/phút làm mức cơ sở.
Từ không trùng là gì và mật độ từ vựng lành mạnh là bao nhiêu?
Từ không trùng là số lượng từ khác biệt trong văn bản sau khi chuyển tất cả về chữ thường. Mật độ từ vựng là từ không trùng chia cho tổng từ, tính theo phần trăm. Với bài viết web và blog, 55–70% là mức điển hình. Dưới 40% thường báo hiệu lặp từ nhiều hoặc nhồi nhét từ khóa. Trên 75% phổ biến trong văn học nghệ thuật.
Mật độ từ khóa là gì và tỷ lệ nào an toàn cho SEO?
Mật độ từ khóa là số lần một từ cụ thể xuất hiện chia cho tổng số từ, tính theo phần trăm. Không có ngưỡng nào được áp dụng chung — hướng dẫn của Google đã không còn đề cập đến các mục tiêu mật độ cụ thể. Theo nguyên tắc thực tế, mức 1–2% cho từ khóa chính giúp tránh các mẫu liên quan đến spam. Nếu bảng Từ phổ biến nhất cho thấy một từ khóa nội dung đạt 4–5%+ trong bài ngắn, hãy cân nhắc đa dạng hóa ngôn ngữ bằng các cụm từ liên quan.
Byte count là gì và khi nào nó quan trọng?
Byte count là kích thước văn bản được mã hóa UTF-8. Với tiếng Anh thuần túy, byte bằng ký tự. Hai chỉ số này phân kỳ với ký tự có dấu (2 byte mỗi ký tự), ký tự CJK (3 byte mỗi ký tự) và emoji (4 byte mỗi ký tự). Byte count quan trọng với: tin nhắn SMS (giới hạn 160 byte GSM-7 mỗi đoạn, 70 byte ở chế độ Unicode); giới hạn cột VARCHAR cơ sở dữ liệu tính theo byte chứ không phải ký tự; ràng buộc kích thước payload API; và hạn mức localStorage trong trình duyệt.
Công cụ này có hoạt động với văn bản không phải tiếng Anh không?
Có. Công cụ đếm từ dùng regex nhận biết Unicode xác định đúng ranh giới từ trong các chữ viết Latin, Cyrillic, Ả Rập, Hebrew, Devanagari, Thái và nhiều chữ viết khác. Với văn bản CJK (Trung, Nhật, Hàn), mỗi chuỗi ký tự liên tục được tính là một từ — có thể không khớp với cách phân tách từ của ngôn ngữ gốc vì tiếng CJK không dùng khoảng trắng giữa các từ. Chỉ số byte count đặc biệt hữu ích với nội dung CJK vì mỗi ký tự dùng 3 byte trong UTF-8.
Công cụ có xử lý được file văn bản rất lớn không?
Có. Toàn bộ quá trình xử lý chạy trong JavaScript engine của trình duyệt, vốn được tối ưu hóa cao cho các thao tác chuỗi. File lên đến vài megabyte xử lý tốt trên thiết bị hiện đại. Với file rất lớn (50 MB trở lên), hiệu suất phụ thuộc vào bộ nhớ khả dụng của thiết bị — nếu trình duyệt chậm lại rõ rệt, hãy thử chia nhỏ file hoặc dùng công cụ dòng lệnh như wc trên Linux/macOS.
Số từ lý tưởng cho bài blog hoặc bài SEO là bao nhiêu?
Không có con số lý tưởng chung — phụ thuộc vào chủ đề, mức độ cạnh tranh và ý định tìm kiếm. Làm mức cơ sở thực tế: bài blog 1.500–2.500 từ hoạt động tốt cho hầu hết các truy vấn thông tin; bài dài 2.500–4.000 từ có xu hướng xếp hạng tốt hơn với từ khóa cạnh tranh cao. Nội dung mỏng dưới 500 từ hiếm khi xếp hạng cho các từ khóa cạnh tranh. Quan trọng hơn số từ thô là bài viết có trả lời đầy đủ câu hỏi của người dùng hay không.
Văn bản của tôi có được bảo mật không?
Có, hoàn toàn. Toàn bộ quá trình tính toán chạy trong trình duyệt của bạn bằng JavaScript thuần — String.match(), Set, Array, TextEncoder. Văn bản của bạn không bao giờ được truyền đến máy chủ của chúng tôi, không bao giờ được ghi log và không bao giờ được lưu trữ. Bạn có thể tự xác minh: mở công cụ nhà phát triển của trình duyệt, chuyển sang tab Mạng và bắt đầu nhập. Bạn sẽ thấy không có yêu cầu mạng ra ngoài nào được kích hoạt bởi công cụ đếm từ.
Tôi có thể điền sẵn công cụ bằng văn bản từ URL không?
Có. Thêm ?input= theo sau là văn bản được mã hóa URL vào địa chỉ trang. Tính năng này hữu ích cho công cụ nội bộ và quy trình CMS liên kết đến công cụ đếm từ này với nội dung đã tải sẵn để kiểm tra trước khi xuất bản. Tránh nhúng văn bản nhạy cảm vào URL — URL được lưu trong lịch sử trình duyệt và có thể xuất hiện trong log máy chủ hoặc proxy.
Nhật ký thay đổi
v1.1.0 23 tháng 5, 2026
- Thiết kế lại bảng nhập với thanh công cụ (Tải lên, Xóa), số thứ tự dòng và thanh trạng thái kích thước
- Thêm thống kê Từ không trùng
- Thêm bảng Từ phổ biến nhất — hiển thị 10 từ xuất hiện nhiều nhất với số lần và thanh phần trăm tương đối
- Đếm từ luôn theo thời gian thực — đã xóa nút Tự động và Đếm ngay
v1.0.0 10 tháng 5, 2026
- Đếm từ, ký tự (có và không có khoảng trắng), câu, đoạn, dòng và byte
- Thời gian đọc ước tính (200 từ/phút) và thời gian nói (130 từ/phút)
- Tải lên file văn bản; hỗ trợ nạp trước qua URL ?input=