MS-DOS và Windows sử dụng một định dạng phổ biến tập tin văn bản, với mỗi dòng văn bản được phân cách bởi một sự kết hợp hai nhân vật: CR và LF, trong đó có mã ASCII 13 và 10. Nó được phổ biến cho các dòng cuối cùng của văn bản không được chấm dứt với một dấu CR-LF, và nhiều biên tập văn bản (bao gồm Notepad) không tự động chèn một trên dòng cuối cùng.
Hầu hết các tập tin văn bản Windows sử dụng một dạng ANSI, OEM hoặc mã hóa Unicode. Những thuật ngữ Windows gọi “ANSI mã hóa” thường là single-byte mã hóa theo tiêu chuẩn ISO-8859, ngoại trừ ở những nơi như Trung Quốc, Nhật Bản và Hàn Quốc yêu cầu các bộ ký tự double-byte. ANSI mã hóa được sử dụng truyền thống như miền địa phương hệ thống mặc định trong Windows, trước khi chuyển đổi sang Unicode.
Ngược lại, các bảng mã OEM, còn được gọi là các trang mã MS-DOS, được xác định bởi IBM để sử dụng trong các hệ thống chế độ hiển thị văn bản IBM PC ban đầu. Họ thường bao gồm các ký tự đồ họa và dòng vẽ thông thường trong (có thể toàn màn hình) các ứng dụng MS-DOS. tập tin văn bản Windows mới hơn có thể sử dụng một bảng mã Unicode như UTF-16LE hoặc UTF-8, với Byte Order Mark.
Add Comment