曾经草原 >> 首页 - 曾经草原网站村欢迎您!!! - - - - - - - - - 呼德格网站系统 V1.02版
《  》
蒙文信息处理国内外研究动态
[日期:2006-3-21 11:44:39]
[字体: ]
新 疆 工 学 院 巴 力 登  -------------------------------------------------------------------------------- 一、 前 言        计 算 机 技 术 的 迅 速 发 展 和 应 用 的 不 断 普 及, 使 人 们 对 计 算 机 字 形 技 术 的 要 求 也 越 来 越 高, 尤 其 是 对 各 种 文 字 处 理 软 件 要 求 有 高 质 量 的 字 型。 在 信 息 处 理 领 域 中, 最 重 要 的 应 用 之 一 就 是 对 文 字 的 处 理。 作 为 文 化 象 征 的 文 字, 其 基 本 特 征 在 不 同 的 民 族 之 间 存 在 着 较 大 的 差 别。 蒙 文 是 拼 音 文 字, 竖 向 书 写 格 式, 自 上 而 下、 从 左 至 右 书 写。 目 前, 以 各 种 形 式 研 究 开 发 的 蒙 文 字 处 理 软 件 日 新 月 异。 笔 者 负 责 设 计 并 制 作 完 成 的 蒙 文True type 字 形, 可 在DOS、Windows 及System 7 中 使 用。 蒙 文 屏 幕 显 示 的 方 法 有 两 种。 一 种 是 横 向 显 示, 即 在 制 作 字 形 过 程 中, 将 蒙 文 字 形 逆 时 针 旋 转90 度, 制 作 成 横 向 的 蒙 文 字 形, 国 内 外 的 多 数 蒙 文 字 处 理 软 件 都 是 采 用 这 种 方 式; 另 一 种 是 竖 向 显 示, 也 就 是 通 常 所 说 的 蒙 文 显 示 方 式, 这 种 显 示 方 式 必 须 对 系 统 软 件 进 行 修 改, 相 对 难 度 较 大。        蒙 古 文 字 是 古 老 的 文 字, 蒙 古 族 分 布 在 世 界 各 地, 对 蒙 古 文 字 的 使 用 有 三 种 代 表 性 的 文 字 形 式。 由 于 历 史 的 原 因, 蒙 古 族 使 用 过 多 种 形 式 的 文 字, 文 字 变 化 比 较 频 繁, 这 也 许 是 游 牧 民 族 文 字 文 化 的 一 种 特 征。        蒙 古 文 字, 一 般 分 为 古 代 前 期 和 古 代 后 期, 是 指 在 畏 兀 儿 文 基 础 上 创 造 的 畏 兀 儿 文 体 回 鹘 蒙 古 文 字, 书 定 格 式 为 竖 向 书 写, 而 畏 兀 儿 文 是 横 向 书 写 的。        元 朝 时 期 又 创 造 了 八 思 巴 蒙 古 文 字, 当 时 称 为“ 国 字”, 也 称 为“ 八 思 巴 字”。 它 是 拼 音 文 字, 字 母 是 参 照 藏 文 字 母 设 计 出 来 的。        近 代 蒙 古 文 字 又 分 为 前 期 近 代 蒙 古 文 字 和 后 期 近 代 蒙 古 文 字, 它 与 畏 兀 儿 文 体 回 鹘 蒙 古 文 字 有 着 不 同 的 原 文 字 体、 文 字 笔 画、 标 点 符 号 及 字 形 等, 形 成 了 符 合 蒙 古 语 言 的 文 字 体 系。 但 是, 这 个 时 期 的 蒙 古 文 字 并 不 统 一。        1648 年, 由 卫 拉 特 和 硕 部 落 的 蒙 古 学 者 扎 亚 · 班 迪 创 造 了 托 忒 蒙 古 文 字。 托 忒 蒙 文 是 对 回 鹘 蒙 古 文 字 中 一 字 多 音 进 行 了 严 格 的 区 分, 并 对 元 音 字 母 和 辅 音 字 母 的 字 体 书 写 进 行 了 修 改 后 而 形 成 的 蒙 古 文 字。 它 在 使 用 过 程 中 又 经 过 几 次 变 化 而 形 成 了 现 在 使 用 的 托 忒 蒙 古 文 字。 托 忒 蒙 古 文 字 的 创 造 不 仅 是 对 近 代 蒙 古 文 字 的 一 次 重 大 改 革, 而 且 对 蒙 古 族 人 民 的 文 化 教 育 事 业 的 发 展 起 了 很 大 的 作 用。        现 代 蒙 古 文 字 按 其 变 化 特 点 及 应 用 范 围 可 划 分 为 前 期 现 代 蒙 古 文 字 和 后 期 现 代 蒙 古 文 字。 即“ 五 四” 运 动 到 建 国 初 期 的 蒙 古 文 字 为 前 期 蒙 古 文 字, 它 的 特 点 是 同 后 期 蒙 古 文 字 较 相 似, 字 母 表 虽 然 较 规 范 化, 但 书 写 规 则 并 不 严 格; 建 国 后 的 蒙 古 文 字 为 后 期 现 代 蒙 古 文 字, 其 特 点、 字 母 形 式、 语 首、 语 中 及 语 尾 的 变 化 较 规 范 化, 有 了 较 严 格 的 语 法 结 构 及 书 写 规 则, 称 为 传 统 的 蒙 古 文 字( 也 称 胡 都 木 蒙 文)。  二、 我 国 蒙 文 信 息 处 理 的 概 况        我 国 是 一 个 统 一 的 多 民 族 国 家。 国 家 在《 宪 法》 和《 民 族 区 域 自 治 法》 中 规 定, 各 民 族 都 有 使 用 和 发 展 自 己 语 言 文 字 的 自 由, 并 积 极 帮 助 各 少 数 民 族 用 自 己 的 语 言 文 字 发 展 教 育。 现 在, 除 回、 满 两 个 民 族 通 用 汉 语 汉 文 外, 其 它53 个 民 族 都 使 用 自 己 的 语 言。 蒙 古、 藏、 维 吾 尔、 哈 萨 克、 柯 尔 克 孜、 锡 伯 及 朝 鲜 等21 个 民 族 使 用 自 己 的30 种 文 字。 民 族 语 言 文 字 十 分 丰 富, 开 发 少 数 民 族 语 言 文 字 信 息 处 理 系 统 是 一 件 很 有 意 义 的 工 作。        我 国 有320 多 万 人 口 在 使 用 蒙 古 文。 各 级 各 类 学 校 用 蒙 古 文 授 课 的 学 生 有44 万 人, 有 十 几 家 蒙 古 文 图 书 出 版 社, 每 年 大 约 出 版500 多 种 蒙 古 文 书 籍, 另 外 还 有520 多 种 蒙 古 文 教 材,16 种 蒙 古 文 报 纸,126 种 蒙 古 文 期 刊。        我 国 有12 万 人 口 及 俄 罗 斯 有15 万 人 口 在 使 用 托 忒 蒙 古 文。 新 疆 地 区 有5 家 报 纸 每 天 用 托 忒 蒙 文 出 报, 有2 家 出 版 社 每 年 出 版 托 忒 蒙 文 书 籍 近100 种。        我 国 的 蒙 古 族 使 用 胡 都 木 蒙 文 和 托 忒 蒙 文 两 种 文 字, 这 是 历 史 发 展 形 成 的。 为 了 使 我 国 蒙 古 文 字 取 得 统 一, 已 在 内 蒙 古、 新 疆、 甘 肃、 青 海 等8 省 及 自 治 区 普 及 和 推 广 统 一 的 胡 都 木 蒙 古 文, 它 是 带 有 通 用 标 准 的 传 统 蒙 古 文 字, 也 是 目 前 国 际 上 通 用 的 蒙 古 文 字。        我 国 制 定 了 蒙 文 国 家 标 准 编 码GB8045-87。 内 蒙 古 电 子 计 算 中 心 在CC-DOS 的 基 础 上 开 发 研 制 了 蒙 文 操 作 系 统MC-DOS2.1, 利 用 旧 版 本 的Wordstar 作 为 文 字 处 理 软 件 输 入 蒙 文, 蒙 文 字 体 采 用 点 阵 字 库。        另 外, 一 些 单 位 和 个 人 也 进 行 了 蒙 文 处 理 系 统 的 二 次 研 究 和 开 发 工 作。 笔 者 开 发 研 制 的MWP 1.0 版 蒙 文 处 理 软 件, 是 在 汉 字 操 作 系 统 环 境 下, 采 取 蒙 文2 字 节 编 码 方 式, 按 蒙 文 的 字 序, 将 语 首、 语 中、 语 尾 的 形 式 进 行 编 码, 软 件 在 输 入 蒙 文 时, 按 下 连 符 自 动 选 择 元 音 字 母 与 辅 音 字 母 的 组 合, 并 且 屏 幕 修 改 方 便。 由 于 需 要 处 理2 字 节 编 码, 所 以 利 用INT16 中 断 处 理 程 序 来 完 成 编 码 转 换, 在INT10 中 断 之 前 执 行INT17 中 断 过 程。 由 于 使 用 的 是 点 阵 字 体, 所 以, 蒙 文 字 体 的 美 观 性 不 足。 打 印 驱 动 程 序 是 修 改INT16 中 断 完 成 的, 修 改 内 容 为: 在 汉、 英 模 式 下 从 左 往 右 打 印。 在 汉、 英、 蒙 文 模 式 下, 蒙 文 顺 时 针 旋 转90 度 后 打 印。 在 蒙、 汉、 英 模 式 下, 同 阿 拉 伯 文 一 样, 从 右 向 左 横 向 打 印。        北 大 方 正 电 子 出 版 系 统 能 处 理 多 种 文 字, 对 组 版、 表 格、 数 学 及 化 学 公 式 等 能 容 易 地 进 行 排 版 处 理, 称 为2 字 节 编 码 的 标 准DTP。 目 前, 我 国 各 地 的 企 业、 新 闻 报 刊、 杂 志 社 等 广 泛 采 用DTP。 作 为 多 种 文 字 处 理 的 专 业 排 版 软 件, 它 可 以 处 理 我 国 少 数 民 族 的 文 字, 如 蒙 古 文、 维 吾 尔 文、 哈 萨 克 文、 柯 尔 克 孜 文、 朝 鲜 文 和 藏 文 等, 具 有 横 向 排 版、 纵 向 排 版、 从 右 向 左、 从 左 向 右 等 自 由 格 式, 操 作 简 便, 但DTP 作 为 行 业 的 专 业 化 软 件, 一 般 用 户 难 以 承 受 其 价 格。 另 外, 在 流 行 的 几 种 汉 卡 中, 如SUPER 汉 卡、M-64405 汉 卡 及WPS 等 都 没 有 处 理 少 数 民 族 文 字 的 功 能。 开 发 和 应 用 具 有 国 际 水 平 的 少 数 民 族 语 言 文 字 处 理 软 件, 仍 是 今 后 的 一 项 重 要 研 究 课 题。  三、 蒙 古 国 的 文 字 处 理 情 况        蒙 古 国 有200 多 万 人 口 使 用 被 称 为 新 蒙 古 文 字 的 斯 拉 夫 字 的 蒙 文。1990 年 蒙 古 国 宣 布, 从1995 年 起 使 用 传 统 的 蒙 古 文 字。 现 在, 两 种 蒙 古 文 字 并 行 使 用。 恢 复 使 用 传 统 的 蒙 古 文 字 有 着 其 特 殊 的 意 义, 但 对 文 化 教 育 来 讲, 确 实 存 在 着 一 系 列 需 解 决 的 问 题。        目 前, 蒙 古 国 也 在 进 行 蒙 古 文 字 信 息 处 理 系 统 软 件 的 开 发 研 究。 如 由 国 立 计 算 机 中 心 开 发 研 制 的IBM PC 英 文DOS 用 斯 拉 夫 文 字 的 驱 动 软 件NCCVGA COM, 由 国 立 大 学 开 发 研 制 的MOSL COM 和DOS 用 竖 写 格 式 蒙 文 字 处 理 软 件SUDAR EXE 以 及Windows 下 使 用 的 应 用 驱 动 软 件。 由Choijil Company 公 司 开 发 研 制 并 销 售 的 软 件 有: 英 文Windows 用 俄 文 驱 动 程 序araWIN 的 蒙 文 数 据 设 定、 新 蒙 文 和 竖 写 格 式 蒙 文 用 的True Type 字 形 等。        字 处 理 软 件SUDAR 在 蒙 古 国 内 比 较 流 行。 它 是 在DOS 环 境 下 工 作, 能 处 理 蒙 文、 新 蒙 文 和 英 文, 具 有 一 般 字 处 理 编 辑 软 件 的 所 有 功 能, 可 用 蒙 文 输 入、 保 存、 编 辑 及 输 出 等, 用 蒙 文 来 输 入 及 编 辑 书 本、 新 闻、 教 课 书 和 文 章, 使 用 十 分 方 便。 利 用Wordstar、word、Wordprofect 等 文 字 处 理 软 件, 使 用 新 蒙 文 及 英 文 输 入 蒙 文 文 稿, 然 后 利 用SUDAR 的 转 换 功 能, 将 蒙 文 印 刷 输 出。SUDAR 提 供7 种 文 件 转 换 功 能, 它 的 键 盘 布 局 是 参 照 俄 文- 蒙 文 打 字 机 设 计 的, 所 以, 使 用 俄 文 打 字 机 的 用 户 可 直 接 利 用SUDAR。        SUDAR 的 工 作 环 境:IBM-PC XT/AT,MS-DOS CGA、EGA、VGA 等,512KB 以 上 内 存 , 点 阵 打 印 机 或 激 光 打 印 机。        SUDAR 软 件 设 计 精 巧, 在 功 能 开 发 上 充 分 利 用DOS 软 中 断 调 用, 特 别 是 屏 幕 控 制 功 能 及 组 合 键 的 利 用 是SUDAR 的 一 个 特 色。 输 入 方 式 为 新 蒙 文 按 旧 打 字 机 的 输 入 方 式, 使 用 英 文 普 通 键 盘。 蒙 文 输 入 采 取 语 中 形 式。 当 需 要 选 择 语 首 时, 输 入 相 应 字 母 中 形 后, 按 下 键“\”, 蒙 文 语 首 形 式 自 动 的 显 示 在 屏 幕 上。 当 单 词 输 入 结 束 后, 按 下 空 格 键, 自 动 选 择 语 尾 形 式。SUDAR 对 蒙 文 的 输 入 处 理 方 式 所 采 取 的 方 法 主 要 是 考 虑 键 盘 布 局 和 蒙 文 语 中 形 式 来 代 替 语 首 形 式, 有 时 不 分 语 首, 整 个 文 档 全 部 是 语 中 形 式。        SUDAR 是 以 处 理 蒙 文 为 目 的 设 计 的 软 件。 目 前,SUDAR 的 打 印 输 出 功 能 中 还 存 在 一 些 问 题, 需 要 进 一 步 改 进。  四、 国 际 上 的 研 究 动 态        蒙 古 文 字 是 蒙 古 族 文 化 的 一 部 分。 目 前, 蒙 古 族 使 用 三 种 不 同 的 文 字 形 式, 即 蒙 文、 托 忒 文 和 新 蒙 文。 国 际 上 一 些 蒙 古 学 学 者 认 为, 从 全 球 范 围 来 看, 蒙 古 文 字 的 使 用 趋 向 于 统 一 化、 通 用 化、 标 准 化、 信 息 化 和 国 际 化。 蒙 古 族 使 用 统 一 文 字 的 可 能 性 是 存 在 的。 这 不 仅 有 利 于 信 息 的 交 换, 而 且 也 有 利 于 蒙 古 族 文 化 的 发 展。50 年 代, 在 蒙 古 国、 俄 罗 斯 和 中 国 境 内 的 蒙 古 族 中 曾 普 及 推 广 斯 拉 夫 蒙 文( 后 称 新 蒙 文), 在 当 时 来 看, 某 种 意 义 上 是 全 球 蒙 古 族 的 文 字 趋 向 于 统 一 使 用 斯 拉 夫 蒙 文。 但 是, 国 际 间 的 交 往 是 复 杂 的, 由 于 政 治 的 原 因, 这 项 工 作 最 终 还 是 宣 告 终 止。 面 对21 世 纪, 这 一 问 题 仍 是 世 界 各 地 蒙 古 学 学 者 深 入 研 究 探 讨 的 课 题。        目 前, 我 国 蒙 古 族 正 使 用 统 一 的 文 字, 这 将 推 动 全 球 范 围 内 蒙 古 族 使 用 同 一 种 文 字 的 进 程, 也 是 我 国 蒙 古 族 所 做 出 的 历 史 性 贡 献。        在 蒙 古 国, 传 统 蒙 古 文 字 作 为 国 字 恢 复 使 用。 所 有 的 学 校、 出 版 发 行 部 门、 国 家 机 关、 对 外 使 节 等 都 要 求 使 用 蒙 文。 国 内 专 门 设 立 了 普 及 传 统 蒙 文 的 机 构, 组 织 专 家 采 取 一 系 列 的 普 及 措 施。 但 另 一 方 面, 在 蒙 古 国 内, 也 有 不 同 的 观 点 和 意 见, 认 为 蒙 古 文 字 在 书 写 科 学 技 术 文 献 资 料 和 公 式 等 方 面 极 不 方 便, 考 虑 到 文 化 的 影 响, 现 阶 段 不 采 用 传 统 蒙 文。        日 本 国 和 蒙 古 国 建 交 以 来, 以 各 种 方 式 开 展 文 化 交 流 活 动, 由 株 式 会 社BIBO 在 苹 果 机 上 排 版 印 刷 完 成 了 蒙 古 儿 童 教 科 书 第 一 册, 作 为 赠 送 物 品。 具 体 完 成 过 程 是 先 设 计 蒙 文 字 体, 然 后 制 作 蒙 文Truetype 字 形, 作 为 系 统 应 用 字 形 文 件, 安 装 到 系 统 上 便 可 使 用, 输 入 采 用 蒙 文 打 字 机 的 键 盘 布 局。 目 前 在 现 有 基 础 上 准 备 试 制 完 成 蒙 文 字 处 理 软 件, 并 正 在 编 辑 输 入 日、 英、 蒙 词 典。        从 事 蒙 文 信 息 处 理 系 统 的 研 究 开 发 工 作 的 有 美 国、 匈 牙 利、 德 国、 俄 罗 斯 及 日 本 等 国, 主 要 的 研 究 领 域 是 蒙 文 字 形、 操 作 系 统、 多 国 语 言 字 处 理 软 件 和 印 刷 出 版 系 统 等。 另 外, 世 界 各 地 阿 尔 太 语 系 学 者 也 提 供 蒙 文 字 形。Gamma Production 公 司 作 为Unicode 的 实 现 者, 以 开 发 多 文 种 字 处 理 或 文 本 编 辑 软 件 著 名, 其 开 发 的 用 于Windows 的Universe 是 一 个 完 备 的、 遵 循Unicode 的 多 文 种 的 字 处 理 系 统 及 字 形 系 统, 适 用 于 世 界 上 的175 种 语 言, 甚 至 含 有 联 体 字(Ligatures) 及 重 迭(overstrikes) 的 最 复 杂 的 语 言 文 字 都 很 容 易 书 写 编 排, 它 能 与 任 何 语 言 文 字 的 组 合 混 用 及 匹 配, 并 通 过 一 次 扫 描 就 可 实 现 多 文 种 的 拼 写 校 对。 该 公 司 的DOS 版MutiLingual Scholar 软 件 和Windows 3.1 下 使 用 的Universe、Unitype 软 件 可 处 理 蒙 文, 也 可 处 理 其px 少 数 民 族 的 文 字, 是 使 用 比 较 方 便 的 软 件 之 一。  五、 蒙 文 编 码        关 于 蒙 文 编 码 方 案, 中 国、 蒙 古 国、 美 国 以 及 一 些 个 人 和 团 体 都 曾 提 出 过 方 案。ISO/IEO 10646 BMP 蒙 古 文 编 码 的 提 案 就 是 我 国 提 出 的。 另 外, 我 国 专 家 进 行 多 次 讨 论 后, 提 出 了 一 套 以 蒙 文 母 为 基 础, 蒙 古 文、 托 忒 文、 满 文( 锡 伯 文) 统 一 认 同 编 码 的 扩 充 方 案, 得 到 了 国 际 标 准 化 组 织 的 初 步 理 解, 预 计 将 可 能 被 批 准 编 入BMP。        蒙 文 字 母 有30 多 个, 分 为 语 首、 语 中、 语 尾 三 种 形 式。 在94 个 字 符 编 码 区 内, 按 照 蒙 文 字 母 的 前 后 连 接 关 系, 找 出 具 有 代 表 性 的 字 母 进 行 编 码。 另 外 一 种 编 码 方 式 是 将 蒙 文 字 母 以 音、 形、 序 在 单 词 中 出 现 的 位 置 来 分 为 细 小 音 素, 进 行 重 复 编 码, 这 种 编 码 方 式 虽 然 重 复 多 次 出 现 同 类 字 符 编 码, 但 在 软 件 处 理 上 比 较 方 便, 字 母 不 是 任 意 进 行 拆 散 的, 便 于 键 盘 布 局。 蒙 文 的 特 点 是 字 母 在 单 词 中 位 置 的 长 度 发 生 变 化, 因 此, 系 统 实 现 中 都 基 本 上 是 采 取 字 母 组 合 的 方 式。        我 国 蒙 文 国 家 标 准GB8045-87 中 选 用82 个 蒙 文 字 符、12 个 符 号, 是 单 字 节 编 码 标 准; 北 大 方 正 电 子 出 版 系 统 中, 蒙 文81 个 字 符,12 个 符 号, 字 与 字 之 间 连 接 机 器 符 号3 个, 托 忒 蒙 文47 个, 满 文42 个;ISO/IEC 1064 BMP 提 案 中,MONGOLIAN 形 式33 个, 托 忒19 个, 满 文15 个, 特 殊 符 号17 个;MONGOLIAN PRES FORMS 形 式 中, 蒙 文107 个, 托 忒56 个, 满 文51 个, 符 号7 个, 提 案 以 蒙、 托、 满 文 组 合 提 出。 笔 者 曾 在《 蒙 古 文 国 际 通 用 编 码 方 案》 一 文 中, 提 出 了 以160 蒙 文 字 符 组 成 的 编 码 字 符 集 提 案。 根 据 以 上 分 析, 在 蒙 文 信 息 量 的 确 切 定 义 上 存 在 着 比 较 大 的 分 歧。 蒙 文 编 码 字 符 到 底 选 用 多 少 合 适, 是 需 要 解 决 的 问 题。  六、 结 束 语        我 国 蒙 文 信 息 处 理 工 作 开 展 得 较 早, 蒙 文 信 息 处 理 的 研 究 开 发 与 应 用 获 得 了 较 大 的 进 展。 随 着 计 算 机 信 息 处 理 技 术 的 不 断 发 展, 今 后 对 蒙 文 信 息 处 理 方 面 的 应 用 和 需 求 将 不 断 扩 大, 因 此, 借 鉴 和 吸 收 国 际 上 的 先 进 经 验 及 技 术, 开 发 实 用 的 蒙 文 字 处 理 软 件 仍 然 是 今 后 的 研 究 课 题。
阅读:4361次  【 复制 】 【 打印