pkg://Hebrew-HOWTO-html.tar.gz:10588/Hebrew-HOWTO-2.html
downloads
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 3.2 Final//EN">
<HTML>
<HEAD><META HTTP-EQUIV="Content-Type" CONTENT="text/html; charset=big5">
<META NAME="GENERATOR" CONTENT="ZH-SGML-Tools 1.0.9">
<TITLE>如何在 Linux 下使用希伯來語: 希伯來文的字元標準</TITLE>
<LINK HREF="Hebrew-HOWTO-3.html" REL=next>
<LINK HREF="Hebrew-HOWTO-1.html" REL=previous>
<LINK HREF="Hebrew-HOWTO.html#toc2" REL=contents>
</HEAD>
<BODY>
<A HREF="Hebrew-HOWTO-3.html">Next</A>
<A HREF="Hebrew-HOWTO-1.html">Previous</A>
<A HREF="Hebrew-HOWTO.html#toc2">Contents</A>
<HR>
<H2><A NAME="s2">2. 希伯來文的字元標準</A></H2>
<H2><A NAME="ss2.1">2.1 ASCII</A>
</H2>
<P>首先, 我要認真地申明一件事: 沒有所謂 8-bit ASCII 這種東西. ASCII 只有 7 個 bit.
任何是 8 個 bit 的字元碼都不可能是 ASCII, 但可以是另一種字元標準.
ISO-8859-8 是一種字元標準, 但不是 ASCII. 請弄清楚這一點!
<P>
<H2><A NAME="ss2.2">2.2 DOS 希伯來文</A>
</H2>
<P>希伯來文字元從 Aleph 中十進位的 128 開始. 因此, 字碼需要 8 個 bit.
在你的影像卡 EPROM 裡有著所有 DOS-based 的希伯來文編輯器 (Qtext, HED, 等) 所使用的硬體字型表.
<P>
<H2><A NAME="ss2.3">2.3 ISO 希伯來文</A>
</H2>
<P>希伯來文字元從 Aleph 中十進位的 224 開始.
這個標準適用於網際網路, 國際字元標準, 以及微軟視窗作業系統及 Macintosh (Dagesh 等).
<P>
<H2><A NAME="ss2.4">2.4 舊 PC 的希伯來文</A>
</H2>
<P>這是一個使用 7 個 bit 且已被淘汰的字元標準.
它所使用的字碼範圍和 ASCII 中英文小寫字母相同, 因此不建議你使用它.
然而, 當某些無知的 Unix 郵件程式將你的 ISO 希伯來文字元中的最高 bit 去掉時
(這時你就會在信件中希伯來文的部份看到一堆混雜著奇怪英文字母的東西),
你就會得到像這樣一個 7-bit 的玩意兒; 這時, 你得把它轉換成 PC 或 ISO.
如果在希伯來文中夾雜了英文, 悲劇便於焉誕生 -
你如果不是會看到希伯來文加上亂碼, 就是亂碼加英文...
<P>
<H2><A NAME="ss2.5">2.5 字元標準轉換</A>
</H2>
<P>以下是一些做字元標準轉換的簡單命令稿 (scripts):
<BLOCKQUOTE><CODE>
<PRE>
DOS - ISO: tr '\200-\232' '\340-\372' < {dos_file} > {iso_file}
ISO - DOS: tr '\340-\372' '\200-\232' < {iso_file} > {dos_file}
OLD - DOS: tr -z '\200-\232' < {old_Hebrew_file} > {dos_file}
</PRE>
</CODE></BLOCKQUOTE>
<P>注意: <CODE>tr</CODE> 使用的數字是八進位的!
<P>
<HR>
<A HREF="Hebrew-HOWTO-3.html">Next</A>
<A HREF="Hebrew-HOWTO-1.html">Previous</A>
<A HREF="Hebrew-HOWTO.html#toc2">Contents</A>
</BODY>
</HTML>