释义:通过一定的哈希算法(典型的有MD5,SHA-1等),将一段较长的数据映射为较短小的数据,这段小数据就是大数据的哈希值。他有这样一个特点,他是唯一的,一旦大数据发生了变化,哪怕是一个微小的变化,他的哈希值也会发生变化。
另外一方面,既然是DNA,那就保证了没有两个数据的哈希值是完全相同的。
哈希值的作用:哈希值,即HASH值,是通过对文件内容进行加密运算得到的一组二进制值,主要用途是用于文件校验或签名。正是因为这样的特点,它常常用来判断两个文件是否相同。
比如,从网络上下载某个e69da5e6ba90e799bee5baa6e997aee7ad9431333366303764文件,只要把这个文件原来的哈希值同下载后得到的文件的哈希值进行对比,如果相同,则表示两个文件完全一致,下载过程没有损坏文件。而如果不一致,则表明下载得到的文件跟原来的文件不同,文件在下载过程中受到了损坏。
另外一方面,既然是DNA,那就保证了没有两个数据的哈希值是完全相同的。
扩展资料:
哈希值,是一种从任何一种数据中创建小的数字“指纹”的方法。哈希值把消息或数据压缩成摘要,使得数据量变小,将数据的格式固定下来。该函数将数据打乱混合,重新创建一个叫做散列值(hash values,hash codes,hash sums,或hashes)的指纹。
散列值通常用一个短的随机字母和数字组成的字符串来代表。好的哈希值在输入域中很少出现散列冲突。在散列表和数据处理中,不抑制冲突来区别数据,会使得数据库记录更难找到。
典型的哈希值都有非常大的定义域,比如SHA-2最高接受(2-1)/8长度的字节字符串。同时哈希值一定有着有限的值域,比如固定长度的比特串。在某些情况下,哈希值可以设计成具有相同大小的定义域和值域间的单射。哈希值必须具有不可逆性。
——来自没什么用的百度百科
好,现在没用的扯完了……
下面说点有用的
哈希值,即copyHASH值,是通过对文件内容进行加密运算得到的一组二进制值,主要用途是用于文件校验或签名。
不同的文件(哪怕细微的差异)得到的哈希值均不相同,因此哈希值可做为文件唯一性判别。
对于普通上网者而言,可道以通过对下载后的文件进行哈希值较验,以判断该文件是否在发布后被人修改过,保证下载的正确性。
类似的还有MD5校验。
也就是说,你的百度网盘上保存的文件有一个固定的代码
通过保存在服务器内的代码你才能下载你保存在自己网盘上的文件
这下你能理解为什么别人的网盘被爆了
而自己的网盘里的文件却和别人的号一起消失
只要有相同的哈希值,官方把一样的哈希值的文件替换或者更改部分
你的保存文件就不能用了
早些年网盘是个视频软件
然而在一次次的大清洗后
你保存的视频却变成了10s的教育片了……
但是文件的大小却丝毫不变
是因为官方把这个视频前面增加原本不属于你的网盘的内容
然后再将余后的文件替换成0字节
在运用哈希值到所有保存该视频的人的网盘中
也就是说,文件在你的网盘中没变
但是官方哪里的哈希值被篡改了
所以你访问的文件会是10s的教育片
(自己查资料理解的,可能有不对的地方,请大大们指正)
详见飞碟说:
https://www.bilibili.com/video/BV1is411N7ec
精简整理版:
百度和谐的是解压后的文件,而不是压缩包;
服务器不会浪费资源多次解压同一个文件,也不会浪费空间储存很多个相同的文件。
你那个压缩包不是被别人用百度云解压过了,就是压缩包里的文件被别人上传到百度云了;
加上服务器自动“扫黄”当然会被和谐了。
最后于 2020-4-13
被凌霄花编辑
,原因: