ASCII文件与二进制文件的区别和联系

下面用实例来演示一下ASCII码和二进制文件之间的区别,帮助大家更加深入的理解这两种文件和编码

1、一个例子:两种100000

程序如下:

#include<iostream>
using namespace std;
int main( )
{
char c[8]=”100000″;
int n=100000;
cout<<“c=”<<c<<endl;
cout<<“n=”<<n<<endl;
return 0;
}

运行结果:
c=100000
n=100000

c和n的输出看起来是一样的,那两者真的一样吗?

显然不是一回事。
有图为证。下面是在CodeBlock中单步执行上面的程序时,跟踪c和n的值看到的情形。

(注:要将待观察的数据以二进制形式显示出来,方法见本文附注部分。)

字符串的c占用了8个字节,保存的是:1个’1’(ASCII码为49,二进制110001)、5个’0’(ASCII码为48,二进制110000),最后2个字节为”(ASCII码为0)
而整型的n,用4个字节(可以将图中二进制1 1000 0110 1010 0000转成十进制,正好100000。本来4字节32位,前面的0省略了。)
重点品味一下n。n在内存中用4字节表示,那样一种形式,对掌握计算机内部机制的人不是回事,但对和计算机尚做不到十分亲近的人而言,32位的数据就是#@!#!@#…。当程序中用cout<<n的方式显示n值时,给出的是100000。可敬的cout!
实际上,cout输出过程中,计算机已经给我们做了转换:将n的二进制内部表示,转换成了人乐于看到的字符形式。

2、将n保存到ASCII文件什么样

#include<fstream>
using namespace std;
int main( )
{
int n=100000;
ofstream out(“a.dat”,ios::out);
out<<n<<endl;
return 0;
}

运行这一段程序,是将n输出到ASCII文件a.dat中。
文件可以用记事本打开,如图:

显然,ASCII文件中表示n时,也是“看起来”的样子,而不是n在内存里的实际表示形式

3、将n保存到二进制文件什么样

#include<fstream>
using namespace std;
int main( )
{
int n=100000;
ofstream out(“b.dat”,ios::out|ios::binary);
out.write((char*)&n, sizeof(n));
return 0;
}

运行这一段程序,是用对二进制文件写入的方式,将n输出到文件b.dat中。
用记事本打开b.dat文件,如图:

纳尼?这是个神马字?你会念吗?开什么玩笑!
找一个查看二进制文件的软件(我用BinaryViewer),看到的b.txt如下:

文件为4字节大。按高位优先的原则(将图中显示的4个字节由后往前取出来),里面保存的数的十六进制形式是:0x000186A0,展开成二进制形式,自然是1 1000 0110 1010 0000,这恰是十进制数100000在内存中的形式。至于为何显示的是那么一个怪字,需要了解汉字编码的知识,参见《 用C++程序理解汉字的机内码表示》(跳转之前,先将本文读完)。

用BinaryViewer也看一下a.txt——前文中另一个也是保存100000的文件,只不过,是ASCII文件。查看结果是:

文件共有8字节,前面的6个字节,保存的是:1个’1’(ASCII码为49,十六进制31)、5个’0’(ASCII码为48,十六进制30)。

由此可以看出二进制文件和ASCII文件的区别:前者,用和内存中一样的方式保存数据;而后者,用和cout显示一样的方式保存,存的是人“看起来”的那个样子。
不方便人看的二进制文件实际上效率更高,用途更广,初学编程的童鞋,不要错过学会它的机会。

附注:用下面的方法将待观察的数据以二进制形式显示出来

在待观察的变量上击鼠标右键,选“Properties”,如下图

在“Format”部分,如下图选择“Binary”后,点击“OK”。

 

本文相关的软甲下载:PXBinaryViewerSetup

发表评论