Công cụ đếm từ

Kích thước: 0 B, 0 ký tự

Từ

0

Từ không trùng

0

Ký tự

0

Không tính khoảng trắng

0

Câu

0

Đoạn văn

0

Dòng

0

Byte

0

Thời gian đọc

0

Thời gian nói

0

Công cụ đếm từ online miễn phí

Dán hoặc nhập văn bản vào ô nhập để lập tức xem mười chỉ số viết lách: số từ, số ký tự, từ không trùng, số câu, số đoạn văn, số dòng, byte, thời gian đọc ước tính, thời gian nói ước tính và bảng tần suất từ khóa hiển thị mười từ được dùng nhiều nhất. Không cần nhấn nút. Không cần đăng nhập. Văn bản của bạn không rời khỏi trình duyệt.

Công cụ này đo những gì

  • Từ: Mỗi chuỗi chữ cái hoặc chữ số liên tiếp được phân tách bằng khoảng trắng tính là một từ. Từ viết tắt (don’t), từ ghép nối (well-known) và số (42) đều được tính là một từ.
  • Từ không trùng: Số lượng từ khác biệt sau khi chuyển tất cả về chữ thường. Mật độ từ vựng 55–70% là mức điển hình cho nội dung web dễ đọc.
  • Ký tự: Tổng số ký tự bao gồm khoảng trắng và dấu câu — mỗi điểm mã Unicode tính là một ký tự.
  • Ký tự không tính khoảng trắng: Số ký tự sau khi loại bỏ toàn bộ khoảng trắng. Dùng khi nền tảng áp đặt giới hạn trên ký tự hiển thị.
  • Câu: Các đoạn văn kết thúc bằng dấu ., !, hoặc ? (và tương đương trong tiếng Trung, Nhật, Hàn). Chữ viết tắt và dấu chấm lửng có thể ảnh hưởng nhẹ đến kết quả.
  • Đoạn văn: Các khối văn bản được phân cách bởi một hoặc nhiều dòng trống.
  • Dòng: Các dấu ngắt dòng cứng. Quan trọng với code, thơ, kịch bản và dữ liệu CSV.
  • Byte: Kích thước mã hóa UTF-8. Cần thiết với payload API, giới hạn cột cơ sở dữ liệu, tiêu đề HTTP và tin nhắn SMS.
  • Thời gian đọc: Ước tính theo 200 từ/phút — tốc độ đọc thầm trung bình của người lớn bản ngữ.
  • Thời gian nói: Ước tính theo 130 từ/phút — nhịp diễn đạt thoải mái cho thuyết trình và podcast.

Cách sử dụng

  1. Dán hoặc nhập văn bản vào ô nhập — mười chỉ số cập nhật ngay lập tức khi bạn gõ.
  2. Dùng nút Tải lên để đọc nội dung từ file .txt trực tiếp trên máy.
  3. Dùng nút Xóa để làm trống và bắt đầu lại từ đầu.
  4. Xem bảng Từ phổ biến nhất bên dưới phần thống kê để biết từ nào xuất hiện nhiều nhất và tỷ lệ của chúng trong toàn bộ văn bản.
  5. Điền sẵn nội dung từ công cụ hoặc CMS bên ngoài bằng cách thêm ?input=nội_dung vào URL trang.

Số từ theo loại nội dung

Mỗi định dạng viết có chuẩn độ dài riêng. Bảng dưới đây là tài liệu tham khảo nhanh khi bạn đang viết theo mục tiêu hoặc kiểm tra số từ.

Loại nội dungĐộ dài thông thườngGhi chú
Tweet / Bài đăng XTối đa 280 ký tựGiới hạn theo ký tự, không phải từ
Mô tả meta Google155–160 ký tựQuá 160 ký tự sẽ bị cắt
Bản tin email200–500 từEmail ngắn có tỷ lệ tương tác cao hơn
Thư xin việc250–400 từMột trang súc tích
Bài luận đại học (Common App)250–650 từGiới hạn cứng được áp dụng
Bài blog1.500–2.500 từNội dung thông tin tiêu chuẩn
Bài SEO dạng dài2.500–4.000 từTương quan với thứ hạng cạnh tranh
Truyện ngắn1.000–7.500 từ
Tiểu thuyết vừa20.000–40.000 từ
Tiểu thuyết70.000–100.000 từDao động nhiều theo thể loại
Luận văn thạc sĩ15.000–25.000 từTùy theo quy định từng trường

Giới hạn ký tự theo nền tảng

Khi chuẩn bị nội dung cho các nền tảng kỹ thuật số, số ký tự thường quan trọng hơn số từ. Đây là giới hạn cứng năm 2026 của các đích xuất bản phổ biến nhất.

Nền tảng / TrườngGiới hạn
Twitter / X post280 ký tự
Twitter / X bio160 ký tự
Tiêu đề tìm kiếm Google50–60 ký tự
Mô tả meta Google155–160 ký tự
Tiêu đề Google Ads30 ký tự mỗi tiêu đề
Mô tả Google Ads90 ký tự mỗi dòng
Tiêu đề quảng cáo Facebook27 ký tự
Caption Instagram2.200 ký tự
Bio Instagram150 ký tự
Bài đăng LinkedIn3.000 ký tự
Tiêu đề LinkedIn220 ký tự
Tiêu đề YouTube70 ký tự
Caption TikTok2.200 ký tự
SMS (mã hóa GSM-7)160 ký tự mỗi đoạn

Từ không trùng và mật độ từ vựng

Chỉ số Từ không trùng đếm số lượng từ khác biệt trong văn bản sau khi chuẩn hóa về chữ thường. Nếu bài viết 1.000 từ của bạn dùng 620 từ khác nhau, mật độ từ vựng là 62%.

Ý nghĩa với chất lượng bài viết: Mật độ cao (trên 60–65%) cho thấy văn xuôi phong phú và cuốn hút. Mật độ thấp (dưới 40%) thường báo hiệu lặp từ nhiều, câu thừa hoặc nhồi nhét từ khóa. Văn học nghệ thuật thường đạt trên 70%, trong khi văn phong hội thoại có thể chỉ đạt 45–55% theo chủ đích.

Ý nghĩa với SEO: Nếu bài viết 2.000 từ chỉ có 400 từ không trùng (20%), một số ít từ có thể xuất hiện hàng chục lần — đây là mẫu mà công cụ tìm kiếm liên kết với việc tối ưu hóa thao túng. Dùng bảng Từ phổ biến nhất cùng với chỉ số từ không trùng: nếu từ khóa mục tiêu nằm trong ba từ xuất hiện nhiều nhất của một bài ngắn, đó là tín hiệu cụ thể để đa dạng hóa ngôn ngữ.

Ý nghĩa với học thuật: Các công cụ phát hiện đạo văn và phân loại nội dung AI đánh dấu mật độ từ vựng bất thường thấp là dấu hiệu của việc xoay vòng văn bản hoặc diễn giải bằng AI. Văn bản do con người viết thực sự trong một lĩnh vực chủ đề nhất định luôn duy trì sự đa dạng từ vựng nhất quán.

Thời gian đọc và thời gian nói

Thời gian đọc được tính ở mức 200 từ/phút — mức trung bình chuẩn cho người lớn đọc thầm tiếng Anh. Thời gian nói dùng 130 từ/phút, phản ánh nhịp trình bày tự nhiên và không vội vã.

Cả hai đều là ước tính. Tốc độ đọc thực tế dao động từ 150 đến 250 từ/phút với văn xuôi thông thường. Tốc độ nói của người dẫn chương trình và diễn giả có kinh nghiệm là 130–160 từ/phút, trong đó 130 từ/phút để lại đủ chỗ cho ngừng nghỉ và nhấn mạnh.

Bảng quy đổi từ sang thời gian:

Thời lượngNói (130 từ/phút)Đọc (200 từ/phút)
1 phút~130 từ~200 từ
2 phút~260 từ~400 từ
5 phút~650 từ~1.000 từ
10 phút~1.300 từ~2.000 từ
15 phút~1.950 từ~3.000 từ
20 phút (TED talk)~2.600 từ~4.000 từ
30 phút~3.900 từ~6.000 từ
45 phút~5.850 từ~9.000 từ
60 phút~7.800 từ~12.000 từ

Với kịch bản podcast, 130 từ/phút là mức nền tin cậy; hầu hết người dẫn dao động từ 120–160 từ/phút. Với video YouTube, hãy lên kế hoạch 120–140 từ/phút để có chỗ cho ngừng nghỉ, khoảnh khắc hình ảnh và nhịp nói tự nhiên.

Từ phổ biến nhất: Bảng tần suất từ khóa

Bảng Từ phổ biến nhất hiển thị mười từ xuất hiện nhiều nhất trong văn bản, kèm số lần xuất hiện và tỷ lệ phần trăm trên tổng số từ. Bảng tự động hiện ra ngay khi văn bản có nội dung và cập nhật theo thời gian thực.

Với người viết nội dung SEO: Dán bản nháp bài viết và kiểm tra xem từ khóa chính có nằm trong phạm vi mong đợi không. Từ khóa mục tiêu xuất hiện ở mức 1–2% tổng số từ là tần suất tự nhiên và an toàn. Nếu bảng cho thấy một từ khóa đạt 4–5%+ trong bài ngắn, sự dư thừa hiện ra ngay lập tức — không cần quét thủ công toàn bộ bài.

Với chất lượng viết nói chung: Văn xuôi lặp lại thường xuất phát từ những từ thói quen vô thức — rất, thực sự, chỉ, mà, thứ. Nếu bảng tần suất cho thấy “chỉ” xuất hiện 14 lần trong email 300 từ, bạn có tín hiệu cụ thể và có thể hành động ngay để chỉnh sửa trước khi gửi.

Lưu ý về stop word: Bảng hiển thị tất cả các từ bao gồm cả từ chức năng phổ biến (the, a, is, và). Đây là chủ đích — trong phân tích nội dung, việc xác nhận rằng “the” đứng đầu danh sách tần suất (chứ không phải một từ khóa ngoài ý muốn) là thông tin hữu ích.

Đếm byte: Chỉ số dành cho lập trình viên

Chỉ số Byte hiển thị kích thước văn bản được mã hóa UTF-8. Với tiếng Anh thuần túy, byte bằng ký tự — mỗi ký tự ASCII dùng đúng một byte. Hai chỉ số này phân kỳ với văn bản không phải ASCII:

  • Ký tự ASCII (a–z, 0–9, dấu câu chuẩn) → 1 byte
  • Ký tự Latin mở rộng (é, ñ, ü) → 2 byte
  • Ký tự CJK (Trung, Nhật, Hàn) → 3 byte
  • Hầu hết emoji → 4 byte

Khi nào byte count quan trọng:

  • SMS: Mã hóa GSM-7 tiêu chuẩn cho phép 160 ký tự mỗi đoạn tin. Chuyển sang Unicode (bắt buộc với emoji hoặc ký tự không phải Latin) giảm giới hạn xuống còn 70 ký tự mỗi đoạn. Một emoji đơn lẻ có thể đẩy tin nhắn 160 ký tự thành tin nhắn nhiều đoạn.
  • Cột cơ sở dữ liệu: MySQL VARCHAR(255) lưu 255 byte, không phải 255 ký tự. Chuỗi 100 ký tự tiếng Trung dùng 300 byte và vượt giới hạn cột. PostgreSQL VARCHAR(n) giới hạn theo số ký tự, không phải byte — biết bạn đang làm việc với cái nào giúp tránh việc cắt ngầm.
  • Payload API: Nhiều API áp đặt giới hạn kích thước body theo byte (thường là 256 KB, 1 MB hoặc 10 MB). Byte count quyết định payload có thể gửi trong một request hay không.
  • Lưu trữ trình duyệt: localStoragesessionStorage có hạn mức dựa trên byte từ 5–10 MB mỗi origin. Khóa localStorage lưu tài liệu lớn sẽ đạt giới hạn nhanh hơn so với số ký tự gợi ý.

Văn bản của bạn không rời khỏi trình duyệt

Công cụ đếm từ thường xử lý nội dung nhạy cảm — bản thảo pháp lý, ghi chú y tế, bản thảo chưa xuất bản, tài liệu kinh doanh độc quyền. Gửi văn bản đó lên máy chủ bên thứ ba để xử lý là rủi ro không cần thiết.

Tại UPREK, cách tiếp cận của chúng tôi đơn giản: toàn bộ quá trình tính toán chạy trong trình duyệt của bạn bằng JavaScript thuần — không có round-trip đến máy chủ, không có ping analytics gắn với bản nháp, không có dịch vụ bên thứ ba nào chạm vào văn bản của bạn.

  • Xử lý 100% cục bộ: Đếm từ, đếm ký tự, tính byte, phân tích từ không trùng và tần suất từ khóa đều chạy trong JavaScript engine của trình duyệt bằng API tích hợp sẵn String.match(), Set, ArrayTextEncoder. Không có thư viện ngoài hay lệnh gọi từ xa nào liên quan.
  • Không tải lên máy chủ: Văn bản của bạn không bao giờ được truyền đến máy chủ của chúng tôi — dù khi dán, khi tải file hay khi nhấn phím bất kỳ.
  • Không ghi log hay lưu trữ: Chúng tôi không ghi lại, lưu trữ hay cache bất kỳ nội dung nào bạn nhập hoặc tải lên công cụ này.
  • Xóa tức thì: Văn bản chỉ tồn tại trong bộ nhớ hoạt động của tab trình duyệt. Đóng tab là mất hết.
  • Có thể kiểm chứng: Mở công cụ nhà phát triển của trình duyệt, chuyển sang tab Mạng và bắt đầu nhập. Bạn sẽ thấy không có yêu cầu mạng ra ngoài nào được kích hoạt bởi công cụ đếm từ.

Điền sẵn nội dung qua tham số URL

Bạn có thể nạp trước văn bản vào ô nhập bằng tham số ?input=:

https://www.uprek.com/vi/tools/cong-cu-dem-tu?input=xin%20chao

Tính năng này hữu ích cho quy trình nội bộ — ví dụ, một nút trong CMS mở công cụ này với bản nháp đã được tải sẵn để kiểm tra độ dài trước khi xuất bản. Tránh nhúng văn bản nhạy cảm vào URL vì URL được lưu trong lịch sử trình duyệt và có thể xuất hiện trong log máy chủ hoặc proxy.

Câu hỏi thường gặp

Cái gì được tính là một từ — số và từ ghép có được tính không?

Có, cả hai đều được tính. Công cụ này dùng mẫu từ nhận biết Unicode khớp với mọi chuỗi chữ cái hoặc chữ số liên tiếp. Số như 42 tính là một từ, từ viết tắt như don't tính là một từ, và từ ghép nối như well-known cũng tính là một từ. Mẫu này áp dụng đúng cho cả chữ viết không phải Latin — tiếng Ả Rập, Devanagari, Cyrillic và các ngôn ngữ khác đều được xử lý chính xác.

Công cụ này chính xác đến đâu so với Microsoft Word hay Google Docs?

Rất gần nhau với văn xuôi thông thường, có thể có sai lệch nhỏ ở các trường hợp đặc biệt. Trình xử lý văn bản áp dụng quy tắc riêng cho URL, địa chỉ email và một số mẫu dấu câu. Với viết lách hằng ngày, các con số khớp gần nhau. Với bài nộp học thuật có giới hạn từ nghiêm ngặt, hãy luôn kiểm tra lại số từ cuối cùng trong phần mềm mà tổ chức của bạn yêu cầu.

Thời gian đọc được tính như thế nào?

Thời gian đọc ước tính ở mức 200 từ/phút — mức trung bình được trích dẫn rộng rãi cho người lớn đọc thầm tiếng Anh. Tốc độ thực tế của từng người thay đổi tùy theo độ phức tạp của văn bản, mức độ quen thuộc với chủ đề và khả năng đọc cá nhân. Người đọc thành thạo thường đạt 150–250 từ/phút với văn xuôi thông thường. Đây là ước tính, không phải đảm bảo.

Bài phát biểu 5 phút cần bao nhiêu từ?

Với tốc độ nói thoải mái 130 từ/phút, bài phát biểu 5 phút cần khoảng 650 từ. Với tốc độ nhanh hơn là 150 từ/phút, 5 phút tương đương khoảng 750 từ. Với bài thuyết trình 10 phút, hãy chuẩn bị 1.300 từ ở mức 130 từ/phút. Với bài nói 20 phút (độ dài TED), hãy lên kế hoạch khoảng 2.600 từ. Thời gian nói hiển thị trong công cụ này dùng 130 từ/phút làm mức cơ sở.

Từ không trùng là gì và mật độ từ vựng lành mạnh là bao nhiêu?

Từ không trùng là số lượng từ khác biệt trong văn bản sau khi chuyển tất cả về chữ thường. Mật độ từ vựng là từ không trùng chia cho tổng từ, tính theo phần trăm. Với bài viết web và blog, 55–70% là mức điển hình. Dưới 40% thường báo hiệu lặp từ nhiều hoặc nhồi nhét từ khóa. Trên 75% phổ biến trong văn học nghệ thuật.

Mật độ từ khóa là gì và tỷ lệ nào an toàn cho SEO?

Mật độ từ khóa là số lần một từ cụ thể xuất hiện chia cho tổng số từ, tính theo phần trăm. Không có ngưỡng nào được áp dụng chung — hướng dẫn của Google đã không còn đề cập đến các mục tiêu mật độ cụ thể. Theo nguyên tắc thực tế, mức 1–2% cho từ khóa chính giúp tránh các mẫu liên quan đến spam. Nếu bảng Từ phổ biến nhất cho thấy một từ khóa nội dung đạt 4–5%+ trong bài ngắn, hãy cân nhắc đa dạng hóa ngôn ngữ bằng các cụm từ liên quan.

Byte count là gì và khi nào nó quan trọng?

Byte count là kích thước văn bản được mã hóa UTF-8. Với tiếng Anh thuần túy, byte bằng ký tự. Hai chỉ số này phân kỳ với ký tự có dấu (2 byte mỗi ký tự), ký tự CJK (3 byte mỗi ký tự) và emoji (4 byte mỗi ký tự). Byte count quan trọng với: tin nhắn SMS (giới hạn 160 byte GSM-7 mỗi đoạn, 70 byte ở chế độ Unicode); giới hạn cột VARCHAR cơ sở dữ liệu tính theo byte chứ không phải ký tự; ràng buộc kích thước payload API; và hạn mức localStorage trong trình duyệt.

Công cụ này có hoạt động với văn bản không phải tiếng Anh không?

Có. Công cụ đếm từ dùng regex nhận biết Unicode xác định đúng ranh giới từ trong các chữ viết Latin, Cyrillic, Ả Rập, Hebrew, Devanagari, Thái và nhiều chữ viết khác. Với văn bản CJK (Trung, Nhật, Hàn), mỗi chuỗi ký tự liên tục được tính là một từ — có thể không khớp với cách phân tách từ của ngôn ngữ gốc vì tiếng CJK không dùng khoảng trắng giữa các từ. Chỉ số byte count đặc biệt hữu ích với nội dung CJK vì mỗi ký tự dùng 3 byte trong UTF-8.

Công cụ có xử lý được file văn bản rất lớn không?

Có. Toàn bộ quá trình xử lý chạy trong JavaScript engine của trình duyệt, vốn được tối ưu hóa cao cho các thao tác chuỗi. File lên đến vài megabyte xử lý tốt trên thiết bị hiện đại. Với file rất lớn (50 MB trở lên), hiệu suất phụ thuộc vào bộ nhớ khả dụng của thiết bị — nếu trình duyệt chậm lại rõ rệt, hãy thử chia nhỏ file hoặc dùng công cụ dòng lệnh như wc trên Linux/macOS.

Số từ lý tưởng cho bài blog hoặc bài SEO là bao nhiêu?

Không có con số lý tưởng chung — phụ thuộc vào chủ đề, mức độ cạnh tranh và ý định tìm kiếm. Làm mức cơ sở thực tế: bài blog 1.500–2.500 từ hoạt động tốt cho hầu hết các truy vấn thông tin; bài dài 2.500–4.000 từ có xu hướng xếp hạng tốt hơn với từ khóa cạnh tranh cao. Nội dung mỏng dưới 500 từ hiếm khi xếp hạng cho các từ khóa cạnh tranh. Quan trọng hơn số từ thô là bài viết có trả lời đầy đủ câu hỏi của người dùng hay không.

Văn bản của tôi có được bảo mật không?

Có, hoàn toàn. Toàn bộ quá trình tính toán chạy trong trình duyệt của bạn bằng JavaScript thuần — String.match(), Set, Array, TextEncoder. Văn bản của bạn không bao giờ được truyền đến máy chủ của chúng tôi, không bao giờ được ghi log và không bao giờ được lưu trữ. Bạn có thể tự xác minh: mở công cụ nhà phát triển của trình duyệt, chuyển sang tab Mạng và bắt đầu nhập. Bạn sẽ thấy không có yêu cầu mạng ra ngoài nào được kích hoạt bởi công cụ đếm từ.

Tôi có thể điền sẵn công cụ bằng văn bản từ URL không?

Có. Thêm ?input= theo sau là văn bản được mã hóa URL vào địa chỉ trang. Tính năng này hữu ích cho công cụ nội bộ và quy trình CMS liên kết đến công cụ đếm từ này với nội dung đã tải sẵn để kiểm tra trước khi xuất bản. Tránh nhúng văn bản nhạy cảm vào URL — URL được lưu trong lịch sử trình duyệt và có thể xuất hiện trong log máy chủ hoặc proxy.

Nhật ký thay đổi

v1.1.0 23 tháng 5, 2026
  • Thiết kế lại bảng nhập với thanh công cụ (Tải lên, Xóa), số thứ tự dòng và thanh trạng thái kích thước
  • Thêm thống kê Từ không trùng
  • Thêm bảng Từ phổ biến nhất — hiển thị 10 từ xuất hiện nhiều nhất với số lần và thanh phần trăm tương đối
  • Đếm từ luôn theo thời gian thực — đã xóa nút Tự động và Đếm ngay
v1.0.0 10 tháng 5, 2026
  • Đếm từ, ký tự (có và không có khoảng trắng), câu, đoạn, dòng và byte
  • Thời gian đọc ước tính (200 từ/phút) và thời gian nói (130 từ/phút)
  • Tải lên file văn bản; hỗ trợ nạp trước qua URL ?input=