我要投搞

标签云

收藏小站

爱尚经典语录、名言、句子、散文、日志、唯美图片

当前位置:神州彩票 > 二进制文件 >

相关阅读

归档日期:04-30       文本归类:二进制文件      文章编辑:爱尚语录

  nginx的access日志自定义格式记录了post请求数据,因为一些原因需要从原始数据恢复出jpg格式图片。

  首先处理日志,筛选出含有图片数据的日志条目,取出其中一条进行分析,大致格式如下,为了便于查看,做一下换行处理:

  由于文件是以二进制方式打开的,读取到的都是原始的流,所以在匹配的时候需要使用\\\\来表示\\。

  这样的匹配处理并不严谨,假设原始数据中本来就含有\\x0D\\x0A--的话,就会丢失原始数据,但目前为止还没遇到这种情况有效。更麻烦的做法是先匹配出表单分割字符串,然后以此为界分割出数据后,再删除两边多余的字符和回车换行。

  成功提取出原始数据后,对数据进行解码,并写入.jpg文件。如果没有解码这一步,所有的数据都会被当做字符串写入文件,而不会被当成转义字符。简单做个测试:

  读取的原始数据是两根反斜杠,print时因为反斜杠被转义成字符,所以变成一根。解码后的数据本身只有一根斜杠,print时打印出转义字符本身,也就是乱码。

  access.log含有多条日志,每条日志都包含图片数据。日志较大,所以不使用readlines(),本来使用list也很占内存,且这样处理比较慢,要等程序把整个文件读完。按行读取日志后提取出图片数据后解码写入文件即可。

  2018年3月19日3月25日上海电台电视台播出的部分沪剧...

  买包子误付14万原因为何 支付宝为何没有短信提醒线岁患病老太求职 丁玉琼老太太求职结果如何最新消息

  红昭愿是抄袭的吗抄袭谁的歌?SING女团抄袭Midnight Fantasy

  汉堡机器人被解雇 快手被搁置因动作太慢无法满足人...

  ②如相关内容涉及版权等问题,请在作品发表之日起一周内与本网联系,我们将在您联系我们之后24小时内予以删除,否则视为放弃相关权利,读者热线 。

本文链接:http://runhappyplace.com/erjinzhiwenjian/115.html