Linux基础IO全解:为何你的printf在fork后输出了两次?17认证网

正规官方授权
更专业・更权威

Linux基础IO全解:为何你的printf在fork后输出了两次?

1. 缓冲区1.1 对实例进行分析

实例一:

#include<stdio.h>#include<unistd.h>#include<string.h>int main(){    const char* msg="hello fwrite!\n";	const char* str="hello write!\n";	//C语言提供的接口    printf("hello printf!\n");    fprintf(stdout,"hello fprintf!\n");	fwrite(msg,strlen(msg),1,stdout);	//操作系统提供的接口	write(1,str,strlen(str));    return 0;}

实例一结果如下:

我们发现所有内容都被打印出来了,没有什么其他现象。


实例二:

#include<stdio.h>#include<unistd.h>#include<string.h>int main(){    const char* msg="hello fwrite!\n";	const char* str="hello write!\n";    //C语言提供的接口    printf("hello printf!\n");    fprintf(stdout,"hello fprintf!\n");	fwrite(msg,strlen(msg),1,stdout);	//操作系统提供的接口	write(1,str,strlen(str));	fork( );    return 0;}

实例二结果如下

和实例一打印的内容相比也没有什么不同的地方。


上面两段代码,唯一不一样的就是实例二中的结尾多了一个fork函数,在正常情况下,实例一和实例二打印的结果没有区别!!!。

如果我将这两段代码的结果放入一个文件当中,结果还是这样吗?

将实例一的内容放入文件log.txt中:

将实例二的内容放入文件log.txt中:

通过将实例一和实例二的内容放入文件,我们发现了不对劲的地方,为什么实例二放入文件后,通过C语言接口打印的内容,竟然打印了两遍?对于这个现象,我先不解释,但我们已经感觉到了,C语言的接口和系统接口有不同之处!

让我们接着看下面三个实例,让我们彻底看清有什么不同!

实例三:

#include<stdio.h>#include<unistd.h>#include<string.h>int main(){	const char* msg="hello fwrite!";    //C语言提供的接口    printf("hello printf!");    fprintf(stdout,"hello fprintf!");    fwrite(msg,strlen(msg),1,stdout);    return 0;}
实例三结果如下:

 
和实例一相比,去掉了’\n’,正常打印,无明显现象
 

 
实例四:
#include<stdio.h>#include<unistd.h>#include<string.h>int main(){	const char* msg="hello fwrite!";    //C语言提供的接口    printf("hello printf!");    fprintf(stdout,"hello fprintf!");    fwrite(msg,strlen(msg),1,stdout);    close(1);    return 0;}

实例四结果如下:

和实例四相比,结尾多了个系统调用的close函数,没有东西打印出来。


实例五:

#include<stdio.h>#include<unistd.h>#include<string.h>int main(){	const char* str="hello write!";	//操作系统提供的接口  	write(1,str,strlen(str));    close(1);    return 0;}

实例五结果如下:

和实例四相比,成功打印出来了


1.2 对实例分析结果进行总结

通过上面五个实例,我们知道了一件事,C语言调用的接口和系统调用的接口区别很大,C语言调用的接口如果没有及时刷新缓冲区就会被close刷掉,或者被拷贝到子进程中,而系统调用的接口则不同,没有被close刷掉,而且是立即打印,没有被子进程拷贝!

调用C语言接口进行的打印,要先放到缓冲区中,这个缓冲区一定不在操作系统内部!!!不是操作系统级别的缓冲区!!!

C语言他会给我们提供一个缓冲区,C接口的调用都会放在该用户级的缓冲区中。

显示器的文件的刷新方案是行刷新,所以在printf执行完要是遇到\n的时候就会进行刷新。(刷新的本质就是将数据通过1和write( )系统接口写入到内核中)

当我们调用close时,该系统调用不会管你用户层有什么,不论你C语言自己提供的缓冲区有没有东西,他都不关心,也不会帮你去刷新缓存区,而是直接close 1号文件描述符所对应的文件缓冲区,让C语言缓冲区的内容无法通过write( )刷新到内核级的文件缓冲区中。

所以,目前,我们认为,只要将数据刷新到了内核,数据就可以到硬件中了。

缓冲区刷新问题(非操作系统内核层,是语言层或用户层)

◉ 无缓冲

直接刷新(不需要等待,直接刷新出来)

◉ 行缓冲

不刷新,直到碰到 ’\n’才刷新 例如:像写入显示器时

◉ 全缓冲

缓冲区满了,才会刷新 例如:向普通文件写入时

进程退出时,会自动刷新缓冲区。


问题一:为什么要有个缓冲区?

◉ 解决效率问题

用户效率问题(例如,我们要将一个快递从湖南运往北京,我们不是直接将快递晕倒北京的,而是通过一个个的快递站,中转站,一步步的送到北京的,这样效率才会高。)

◉ 配合格式化

例如输入123,我们怎么知道他是字符123还是数字123,就要通过%s或%d的格式化来表达,而缓冲区就可以做到类型转化。

问题二:这个缓冲区在哪里呢?

首先,我们知道既然是文件操作,那就一定绕不开FILE struct ,FILE里面封装了fd(文件操作符),同样,FILE里面还有对应打开文件的缓冲区字段和维护的信息!!!

如图所示:

问题三:这个FILE对象是属于用户呢?还是属于操作系统呢?这个缓冲区是不是属于用户级的缓冲区呢?

语言方面的都属于用户层,缓冲区也是用户级的。

问题四:关于将实例二中的内容打印到文件中,发生的C语言接口打印了两次怎么解释?

向文件打印时,缓冲区刷新方案变成了全缓冲刷新,所以,只有等缓冲区满了,或进程结束才会刷新,所以,当我们执行fork时,那些还在缓冲区的数据,就会发生写实拷贝,将这些缓冲区里的数据拷贝到子进程C语言提供的缓冲区当中,当进程结束,就会刷新缓冲区,然后通过调用系统接口write和1号文件描述符所对应的文件缓冲区打印到显示器上。

总结:

本文章,从分析问题、解决问题和回答问题的角度,从几个现象入手,逐步剖析内涵的缓冲区原理,我们也了解到了什么是内核文件缓冲区,什么是C语言自己提供的文件缓冲区!!!

想了解更多干货,可通过下方扫码关注

可扫码添加上智启元官方客服微信👇

未经允许不得转载:17认证网 » Linux基础IO全解:为何你的printf在fork后输出了两次?
分享到:0

评论已关闭。

400-663-6632
咨询老师
咨询老师
咨询老师