ITPUB论坛-中国最专业的IT技术社区

 
 注册
热搜:
楼主: chen222246lei

exp utf8->us7ascii imp us7ascii->utf8 中文为什么没有乱码?

[复制链接]
论坛徽章:
120
现任管理团队成员
日期:2011-05-07 01:45:08弗兰奇
日期:2018-01-31 17:04:24ITPUB15周年纪念
日期:2018-02-08 11:01:54托尼托尼·乔巴
日期:2018-03-14 18:48:34
11#
发表于 2018-1-11 09:39 | 只看该作者
本帖最后由 zergduan 于 2018-1-11 09:41 编辑

这样看就可以

捕获.PNG (28.31 KB, 下载次数: 4)

捕获.PNG

使用道具 举报

回复
论坛徽章:
120
现任管理团队成员
日期:2011-05-07 01:45:08弗兰奇
日期:2018-01-31 17:04:24ITPUB15周年纪念
日期:2018-02-08 11:01:54托尼托尼·乔巴
日期:2018-03-14 18:48:34
12#
发表于 2018-1-11 09:43 | 只看该作者
US7ACSII 有00~ff所有单位编码,所以你导出肯定不需要做编码替换,所以整个编码都被正常导出了。同时导入的时候由于US7ASCII是所有字符集的子集,也是UTF8的子集,一样不需要编码转换,直接把编码写入了。因此,不会丢失任何编码

使用道具 举报

回复
论坛徽章:
6
CTO参与奖
日期:2009-02-20 09:44:20数据库板块每日发贴之星
日期:2009-04-02 01:01:032009日食纪念
日期:2009-07-22 09:30:002010新春纪念徽章
日期:2010-03-01 11:21:02咸鸭蛋
日期:2011-08-29 08:45:46ITPUB十周年纪念徽章
日期:2011-11-01 16:20:28
13#
 楼主| 发表于 2018-1-11 15:35 | 只看该作者
我在网上看到了有人反映,数据库字符集是ZHS16GBK, 客户端为US7ASCII时, 会乱码, 我做了一个新测试, 新建一个数据库, 把数据库字符集设置为ZHS16GBK, 测试结果仍然没有出现乱码, 我有一点疑问. US7ASCII所包含的编码范围应该是ORACLE中最小的字符集了. 如果US7ASCII都可以做到转换无乱码, 那么其他字符集也不会出现乱码. 所以我又把客户端字符集设置为WE8ISO8859P1, 其结果能够正常显示汉字.  

使用道具 举报

回复
论坛徽章:
6
CTO参与奖
日期:2009-02-20 09:44:20数据库板块每日发贴之星
日期:2009-04-02 01:01:032009日食纪念
日期:2009-07-22 09:30:002010新春纪念徽章
日期:2010-03-01 11:21:02咸鸭蛋
日期:2011-08-29 08:45:46ITPUB十周年纪念徽章
日期:2011-11-01 16:20:28
14#
 楼主| 发表于 2018-1-11 15:39 | 只看该作者
我觉得一定是自己那个地方没弄清楚. 目前测试情况来看. 下面这些情况都不会出现乱码
源数据库         客户端             目标数据库     结果
AL32UTF8        US7ASCII             AL32UTF8       正常
AL32UTF8      WE8ISO8859P1      AL32UTF8       正常
ZHS16GBK        US7ASCII             ZHS16GBK       正常
ZHS16GBK        WE8ISO8859P1    ZHS16GBK       正常

使用道具 举报

回复
论坛徽章:
29
ITPUB社区千里马徽章
日期:2013-06-21 13:15:17itpub13周年纪念徽章
日期:2014-09-28 10:55:55马上有房
日期:2014-12-26 16:11:152015年新春福章
日期:2015-03-04 14:53:162015年新春福章
日期:2015-03-06 11:58:39秀才
日期:2017-02-22 15:16:26乌索普
日期:2017-02-28 15:30:00蒙奇·D·路飞
日期:2017-08-28 16:16:37罗罗诺亚·索隆
日期:2017-09-08 13:32:34马上加薪
日期:2014-02-28 10:51:12
15#
发表于 2018-1-11 18:13 | 只看该作者
chen222246lei 发表于 2018-1-11 15:39
我觉得一定是自己那个地方没弄清楚. 目前测试情况来看. 下面这些情况都不会出现乱码
源数据库         客 ...

这里的客户端nls_lang和客户单操作系统的字符集是一致的吧?

使用道具 举报

回复
论坛徽章:
120
现任管理团队成员
日期:2011-05-07 01:45:08弗兰奇
日期:2018-01-31 17:04:24ITPUB15周年纪念
日期:2018-02-08 11:01:54托尼托尼·乔巴
日期:2018-03-14 18:48:34
16#
发表于 2018-1-11 18:30 | 只看该作者
chen222246lei 发表于 2018-1-11 15:35
我在网上看到了有人反映,数据库字符集是ZHS16GBK, 客户端为US7ASCII时, 会乱码, 我做了一个新测试, 新建一 ...

你说的有2个错误

1. 虽然US7ASCII是最小字符集,但是他包含了全部单位字符编码(看我上面的解释)
2. 所谓的出现乱码,是因为字符替换,你看到乱码是因为转换后发生了字符替换,替换字符是一个通用图形(乱码),但是exp/imp 并没有显示字符,所以你“看不到”乱码,单位字符被全部覆盖,所以编码在这个过程中也不会被替换。

使用道具 举报

回复
论坛徽章:
120
现任管理团队成员
日期:2011-05-07 01:45:08弗兰奇
日期:2018-01-31 17:04:24ITPUB15周年纪念
日期:2018-02-08 11:01:54托尼托尼·乔巴
日期:2018-03-14 18:48:34
17#
发表于 2018-1-11 18:32 | 只看该作者
lnwf5188588 发表于 2018-1-11 18:13
这里的客户端nls_lang和客户单操作系统的字符集是一致的吧?

他说的是导出/导入时设置的NLS_LANG,此时设置的这个变量与操作系统无关(因为不需要用来显示字形)仅供Oracle来判断是否被要求做字符转换。

使用道具 举报

回复
论坛徽章:
6
CTO参与奖
日期:2009-02-20 09:44:20数据库板块每日发贴之星
日期:2009-04-02 01:01:032009日食纪念
日期:2009-07-22 09:30:002010新春纪念徽章
日期:2010-03-01 11:21:02咸鸭蛋
日期:2011-08-29 08:45:46ITPUB十周年纪念徽章
日期:2011-11-01 16:20:28
18#
 楼主| 发表于 2018-1-12 09:26 | 只看该作者
zergduan 发表于 2018-1-11 18:32
他说的是导出/导入时设置的NLS_LANG,此时设置的这个变量与操作系统无关(因为不需要用来显示字形)仅供Or ...

意思我懂了, 也就是说只要字符集提供了所有字符的编码(0x00 ~ 0xff) 那么即使编码没有对应正确的字符, 那么转换也不会有任何问题. 那么验证方法也很简单, 只要找出没有提供全字符编码的字符集做个测试即可. 那么我如何知道那种字符集没有提供全字符编码呢? 请问那个local build查看字符集提供的编码是如何使用的呢?

使用道具 举报

回复
论坛徽章:
20
迷宫蛋
日期:2011-11-25 14:00:472015年新春福章
日期:2015-03-06 11:57:31天枰座
日期:2015-07-18 17:23:54暖羊羊
日期:2015-06-15 10:03:48托尼托尼·乔巴
日期:2017-01-25 09:38:19秀才
日期:2017-03-02 10:30:14秀才
日期:2017-03-02 10:30:35秀才
日期:2017-06-29 10:16:48技术图书徽章
日期:2017-07-11 09:10:26喜羊羊
日期:2015-03-04 14:49:39
19#
发表于 2018-1-12 10:41 | 只看该作者
dmp文件是二进制的,只要你源数据库和目标数据库的字符集一致,就不会有乱码,只有存储过程里的注释,导出时不是byte,会产生乱码,exp的nls_lang,不会对表的数据做转换.

使用道具 举报

回复
论坛徽章:
6
CTO参与奖
日期:2009-02-20 09:44:20数据库板块每日发贴之星
日期:2009-04-02 01:01:032009日食纪念
日期:2009-07-22 09:30:002010新春纪念徽章
日期:2010-03-01 11:21:02咸鸭蛋
日期:2011-08-29 08:45:46ITPUB十周年纪念徽章
日期:2011-11-01 16:20:28
20#
 楼主| 发表于 2018-1-12 10:58 | 只看该作者
dhhb 发表于 2018-1-12 10:41
dmp文件是二进制的,只要你源数据库和目标数据库的字符集一致,就不会有乱码,只有存储过程里的注释,导出 ...

源数据库和目标数据库字符集不一致,使用US7ASCII转换也不会出现乱码.
测试环境:
源数据库 AL32UTF8
客户端字符集: US7ASCII
目标数据库: ZHS16GBK
测试结果完全没有问题,

使用道具 举报

回复

您需要登录后才可以回帖 登录 | 注册

本版积分规则

TOP技术积分榜 社区积分榜 徽章 团队 统计 知识索引树 积分竞拍 文本模式 帮助
  ITPUB首页 | ITPUB论坛 | 数据库技术 | 企业信息化 | 开发技术 | 微软技术 | 软件工程与项目管理 | IBM技术园地 | 行业纵向讨论 | IT招聘 | IT文档 |
  | | |
CopyRight 1999-2011 itpub.net All Right Reserved. 北京盛拓优讯信息技术有限公司版权所有 联系我们 网站律师 隐私政策 知识产权声明
 北京市公安局海淀分局网监中心备案编号:11010802021510 广播电视节目制作经营许可证:编号(京)字第1149号
  
快速回复 返回顶部 返回列表