Định dạng file TXT

UTF-8

Trong bối cảnh tập tin văn bản tiếng Anh có thể được duy nhất ASCII, khi trong một bối cảnh quốc tế tập tin văn bản thường là 8 bit cho phép cho phép lưu trữ các văn bản bản địa.

Trong những bối cảnh quốc tế, một Byte Order Mark có thể xuất hiện trong đầu của tập tin để phân biệt UTF-8 mã hóa từ di sản mã hóa trong khu vực.

ASCII

Các tiêu chuẩn ASCII phép các tập tin văn bản ASCII chỉ (không giống như hầu hết các loại tập tin khác) để được tự do trao đổi và có thể đọc được trên Unix, Macintosh, Microsoft Windows, hệ điều hành DOS, và các hệ thống khác. Những khác biệt trong hội nghị kết thúc dòng ưa thích của họ và giải thích của họ về giá trị bên ngoài phạm vi ASCII (mã hóa ký tự của họ).

MIME

Tập tin văn bản thường có kiểu MIME “text / plain”, thường là với thông tin bổ sung cho thấy một mã hóa. Trước khi sự ra đời của Mac OS X, hệ thống Mac OS coi nội dung của một tập tin (dữ liệu ngã ba) là một tập tin văn bản khi ngã ba nguồn tài nguyên của nó chỉ ra rằng các loại file bị “TEXT”. Theo hệ điều hành Microsoft Windows, một tập tin được coi như là một tập tin văn bản nếu các hậu tố của tên của tập tin (mở rộng “”) là “txt”. Tuy nhiên, nhiều hậu tố khác được sử dụng cho các tập tin văn bản với mục đích cụ thể. Ví dụ, mã nguồn cho chương trình máy tính thường được giữ trong các tập tin văn bản có hậu tố tên tập tin chỉ ra ngôn ngữ lập trình trong đó nguồn được viết.

.TXT

.txt là một định dạng tập tin cho các tập tin bao gồm các văn bản thường có chứa rất ít định dạng (ví dụ, không in đậm hoặc in nghiêng). Định nghĩa chính xác của các định dạng .txt không được xác định, nhưng thông thường phù hợp với định dạng được chấp nhận bởi các thiết bị đầu cuối của hệ thống hoặc soạn thảo văn bản đơn giản. Những tập tin có phần mở rộng .txt có thể dễ dàng được đọc hoặc mở bất kỳ chương trình đọc văn bản, và vì lý do đó, được coi là phổ quát (hay nền tảng độc lập).

Các ký tự ASCII là định dạng phổ biến nhất cho các tập tin văn bản bằng tiếng Anh, và thường được coi là định dạng tập tin mặc định trong nhiều tình huống. Đối với các ký tự ASCII có dấu và khác, nó là cần thiết để chọn một ký tự mã hóa. Trong nhiều hệ thống, điều này được lựa chọn trên cơ sở của miền địa phương mặc định cài đặt trên máy tính của nó được đọc trong ngày. bảng mã ký tự thường gặp bao gồm ISO 8859-1 cho nhiều ngôn ngữ châu Âu.

Bởi vì nhiều mã hóa chỉ có một tiết mục hạn chế về nhân vật, họ thường chỉ có thể sử dụng để đại diện cho văn bản trong một tập con hạn chế về ngôn ngữ của con người. Unicode là một nỗ lực để tạo ra một tiêu chuẩn chung cho đại diện cho tất cả các ngôn ngữ được biết đến, và được biết hầu hết các bộ ký tự là tập con của các bộ ký tự Unicode rất lớn. Mặc dù có rất nhiều bảng mã ký tự có sẵn cho Unicode, phổ biến nhất là UTF-8, trong đó có lợi thế là tương thích ngược với ASCII: đó là, mỗi tập tin văn bản ASCII cũng là một tập tin văn bản UTF-8 với ý nghĩa giống nhau.

Vấn đề chính giữa ASCII thuần khiết và UTF-8 thuần là hạn chế sự hiện diện hay vắng mặt của HĐQT. Theo Unicode Microsoft giao thức cho các tập tin txt sử dụng UTF-8.

.TEXT
.text là một phần mở rộng tập tin thay thế cho .txt.

Add Comment

Your email address will not be published. Required fields are marked *

Style switcher RESET
Body styles
Color settings
Link color
Menu color
User color
Background pattern
Background image
error: Nội dung được bảo vệ !