我是小小强,这是我的第1篇原创文章,阅读需要大约15分钟。
网络开发时,调用send和recv进行数据收发,经常会遇到一些异常问题,导致返回值为-1,errno被置为某个特殊值。这时就需要我们根据经验,结合实际情况判断问题症结,这样才能快速定位和处理问题。下面总结了一些开发中,经常会遇到的问题。
-
Connection reset by peer
这个错误一般是对端已经关闭连接(处于关闭连接过程中),本端依然向对端发送数据导致。 -
Broken pipe
这个错误一般是向一个已经关闭的套接字中写数据,导致管道错误。默认操作系统会终止进程,在c程序中需要将该信号忽略。
当向一个已经关闭的链接发送数据时,由于处于tcp的状态不同,可能会导致上面两种不同的结果。 -
errno为EAGAIN EWOULDBLOCK EINTR
这个是程序中当send和recv返回-1时,判断errno如果为上述值,需要再次send和recv。有下面几个情况:- 用于非阻塞套接字
- 阻塞套接字,但是设置了SO_RCVTIMEO和SO_SNDTIMEO
- O_NODELAY会导致write接口返回EAGAIN。如果设置了O_NODELAY而当前不可写,那么write接口会设置errno为EAGAIN,但是write接口会返回0而不是-1。
-
**recv返回0 **
这个是对端已经正常关闭套接字,本端获取这个返回值时,也应当正常关闭。如果对端调用close关闭套接字,本端的recv会从阻塞状态(如果处于阻塞的话)立即返回0。 -
send和recv一直阻塞
用于非阻塞套接字,且未设置超时时间。有以下情况:- 发送方阻塞:内核发送缓冲区已满,无法将数据从用户空间拷贝到内核空间,一般对端未及时读取数据导致。
- 接收方阻塞:发送方未发送数据导致内核接收缓冲区为空或者应用未及时取走数据。
在阻塞状态下,如果断开网络连接,有可能一直阻塞下去。
另外在java中,会有一些异常,从网上摘录如下
Connection reset by peer的常见原因:
1)服务器的并发连接数超过了其承载量,服务器会将其中一些连接关闭;
如果知道实际连接服务器的并发客户数没有超过服务器的承载量,则有可能是中了病毒或者木马,引起网络流量异常。可以使用netstat -an查看网络连接情况。
2)客户关掉了浏览器,而服务器还在给客户端发送数据;
3)浏览器端按了Stop;
这两种情况一般不会影响服务器。但是如果对异常信息没有特别处理,有可能在服务器的日志文件中,重复出现该异常,造成服务器日志文件过大,影响服务器的运行。可以对引起异常的部分,使用try...catch捕获该异常,然后不输出或者只输出一句提示信息,避免使用e.printStackTrace();输出全部异常信息。
4)防火墙的问题;
如果网络连接通过防火墙,而防火墙一般都会有超时的机制,在网络连接长时间不传输数据时,会关闭这个TCP的会话,关闭后在读写,就会导致异常。 如果关闭防火墙,解决了问题,需要重新配置防火墙,或者自己编写程序实现TCP的长连接。实现TCP的长连接,需要自己定义心跳协议,每隔一段时间,发送一次心跳协议,双方维持连接。
5)JSP的buffer问题。
JSP页面缺省缓存为8k,当JSP页面数据比较大的时候,有可能JSP没有完全传递给浏览器。这时可以适当调整buffer的大小。 <%@ page buffer="100k"%>
其它异常
already in use: JVM_Bind。该异常发生在服务器端进行new ServerSocket(port)(port是一个0,65536的整型值)操作时。异常的原因是以为与port一样的一个端口已经被启动,并进行监听。此时用netstat –an命令,可以看到一个Listending状态的端口。只需要找一个没有被占用的端口就能解决这个问题。
客户端错误代码10053 Software caused connection abort(软件原因导致连接中断)