区块链入门教程

作者: 阮一峰

日期: 2017年12月26日

珠峰培训

区块链(blockchain)是眼下的大热门,新闻媒体大量报道,宣称它将创造未来。

可是,简单易懂的入门文章却很少。区块链到底是什么,有何特别之处,很少有解释。

下面,我就来尝试,写一篇最好懂的区块链教程。毕竟它也不是很难的东西,核心概念非常简单,几句话就能说清楚。我希望读完本文,你不仅可以理解区块链,还会明白什么是挖矿、为什么挖矿越来越难等问题。

需要说明的是,我并非这方面的专家。虽然很早就关注,但是仔细地了解区块链,还是从今年初开始。文中的错误和不准确的地方,欢迎大家指正。

一、区块链的本质

区块链是什么?一句话,它是一种特殊的分布式数据库。

首先,区块链的主要作用是储存信息。任何需要保存的信息,都可以写入区块链,也可以从里面读取,所以它是数据库。

其次,任何人都可以架设服务器,加入区块链网络,成为一个节点。区块链的世界里面,没有中心节点,每个节点都是平等的,都保存着整个数据库。你可以向任何一个节点,写入/读取数据,因为所有节点最后都会同步,保证区块链一致。

二、区块链的最大特点

分布式数据库并非新发明,市场上早有此类产品。但是,区块链有一个革命性特点。

区块链没有管理员,它是彻底无中心的。其他的数据库都有管理员,但是区块链没有。如果有人想对区块链添加审核,也实现不了,因为它的设计目标就是防止出现居于中心地位的管理当局。

正是因为无法管理,区块链才能做到无法被控制。否则一旦大公司大集团控制了管理权,他们就会控制整个平台,其他使用者就都必须听命于他们了。

但是,没有了管理员,人人都可以往里面写入数据,怎么才能保证数据是可信的呢?被坏人改了怎么办?请接着往下读,这就是区块链奇妙的地方。

三、区块

区块链由一个个区块(block)组成。区块很像数据库的记录,每次写入数据,就是创建一个区块。

每个区块包含两个部分。

  • 区块头(Head):记录当前区块的元信息
  • 区块体(Body):实际数据

区块头包含了当前区块的多项元信息。

  • 生成时间
  • 实际数据(即区块体)的 Hash
  • 上一个区块的 Hash
  • ...

这里,你需要理解什么叫 Hash,这是理解区块链必需的。

所谓 Hash 就是计算机可以对任意内容,计算出一个长度相同的特征值。区块链的 Hash 长度是256位,这就是说,不管原始内容是什么,最后都会计算出一个256位的二进制数字。而且可以保证,只要原始内容不同,对应的 Hash 一定是不同的。

举例来说,字符串123的 Hash 是a8fdc205a9f19cc1c7507a60c4f01b13d11d7fd0(十六进制),转成二进制就是256位,而且只有123能得到这个 Hash。

因此,就有两个重要的推论。

  • 推论1:每个区块的 Hash 都是不一样的,可以通过 Hash 标识区块。
  • 推论2:如果区块的内容变了,它的 Hash 一定会改变。

四、 Hash 的不可修改性

区块与 Hash 是一一对应的,每个区块的 Hash 都是针对"区块头"(Head)计算的。

Hash = SHA256(区块头)

上面就是区块 Hash 的计算公式,Hash 由区块头唯一决定,SHA256是区块链的 Hash 算法。

前面说过,区块头包含很多内容,其中有当前区块体的 Hash(注意是"区块体"的 Hash,而不是整个区块),还有上一个区块的 Hash。这意味着,如果当前区块的内容变了,或者上一个区块的 Hash 变了,一定会引起当前区块的 Hash 改变。

这一点对区块链有重大意义。如果有人修改了一个区块,该区块的 Hash 就变了。为了让后面的区块还能连到它,该人必须同时修改后面所有的区块,否则被改掉的区块就脱离区块链了。由于后面要提到的原因,Hash 的计算很耗时,同时修改多个区块几乎不可能发生,除非有人掌握了全网51%以上的计算能力。

正是通过这种联动机制,区块链保证了自身的可靠性,数据一旦写入,就无法被篡改。这就像历史一样,发生了就是发生了,从此再无法改变。

每个区块都连着上一个区块,这也是"区块链"这个名字的由来。

五、采矿

由于必须保证节点之间的同步,所以新区块的添加速度不能太快。试想一下,你刚刚同步了一个区块,准备基于它生成下一个区块,但这时别的节点又有新区块生成,你不得不放弃做了一半的计算,再次去同步。因为每个区块的后面,只能跟着一个区块,你永远只能在最新区块的后面,生成下一个区块。所以,你别无选择,一听到信号,就必须立刻同步。

所以,区块链的发明者中本聪(这是假名,真实身份至今未知)故意让添加新区块,变得很困难。他的设计是,平均每10分钟,全网才能生成一个新区块,一小时也就六个。

这种产出速度不是通过命令达成的,而是故意设置了海量的计算。也就是说,只有通过极其大量的计算,才能得到当前区块的有效 Hash,从而把新区块添加到区块链。由于计算量太大,所以快不起来。

这个过程就叫做采矿(mining),因为计算有效 Hash 的难度,好比在全世界的沙子里面,找到一粒符合条件的沙子。计算 Hash 的机器就叫做矿机,操作矿机的人就叫做矿工。

六、难度系数

读到这里,你可能会有一个疑问,人们都说采矿很难,可是采矿不就是用计算机算出一个 Hash 吗,这正是计算机的强项啊,怎么会变得很难,迟迟算不出来呢?

原来不是任意一个 Hash 都可以,只有满足条件的 Hash 才会被区块链接受。这个条件特别苛刻,使得绝大部分 Hash 都不满足要求,必须重算。

原来,区块头包含一个难度系数(difficulty),这个值决定了计算 Hash 的难度。举例来说,第100000个区块的难度系数是 14484.16236122。

区块链协议规定,使用一个常量除以难度系数,可以得到目标值(target)。显然,难度系数越大,目标值就越小。

Hash 的有效性跟目标值密切相关,只有小于目标值的 Hash 才是有效的,否则 Hash 无效,必须重算。由于目标值非常小,Hash 小于该值的机会极其渺茫,可能计算10亿次,才算中一次。这就是采矿如此之慢的根本原因。

区块头里面还有一个 Nonce 值,记录了 Hash 重算的次数。第 100000 个区块的 Nonce 值是274148111,即计算了 2.74 亿次,才得到了一个有效的 Hash,该区块才能加入区块链。

七、难度系数的动态调节

就算采矿很难,但也没法保证,正好十分钟产出一个区块,有时一分钟就算出来了,有时几个小时可能也没结果。总体来看,随着硬件设备的提升,以及矿机的数量增长,计算速度一定会越来越快。

为了将产出速率恒定在十分钟,中本聪还设计了难度系数的动态调节机制。他规定,难度系数每两周(2016个区块)调整一次。如果这两周里面,区块的平均生成速度是9分钟,就意味着比法定速度快了10%,因此难度系数就要调高10%;如果平均生成速度是11分钟,就意味着比法定速度慢了10%,因此难度系数就要调低10%。

难度系数越调越高(目标值越来越小),导致了采矿越来越难。

八、区块链的分叉

即使区块链是可靠的,现在还有一个问题没有解决:如果两个人同时向区块链写入数据,也就是说,同时有两个区块加入,因为它们都连着前一个区块,就形成了分叉。这时应该采纳哪一个区块呢?

现在的规则是,新节点总是采用最长的那条区块链。如果区块链有分叉,将看哪个分支在分叉点后面,先达到6个新区块(称为"六次确认")。按照10分钟一个区块计算,一小时就可以确认。

由于新区块的生成速度由计算能力决定,所以这条规则就是说,拥有大多数计算能力的那条分支,就是正宗的比特链。

九、总结

区块链作为无人管理的分布式数据库,从2009年开始已经运行了8年,没有出现大的问题。这证明它是可行的。

但是,为了保证数据的可靠性,区块链也有自己的代价。一是效率,数据写入区块链,最少要等待十分钟,所有节点都同步数据,则需要更多的时间;二是能耗,区块的生成需要矿工进行无数无意义的计算,这是非常耗费能源的。

因此,区块链的适用场景,其实非常有限。

  1. 不存在所有成员都信任的管理当局
  2. 写入的数据不要求实时使用
  3. 挖矿的收益能够弥补本身的成本

如果无法满足上述的条件,那么传统的数据库是更好的解决方案。

目前,区块链最大的应用场景(可能也是唯一的应用场景),就是以比特币为代表的加密货币。下一篇文章,我将会介绍比特币的入门知识

十、参考链接

(完)

一灯学堂

优达学城

留言(126条)

哈哈 沙发 期待下一篇关于比特币的介绍

比特币的中心思想好像就是这个,去中心化,每进行一笔交易,周围所有的节点都会知道这笔交易

那辛辛苦苦挖出来的区块后面接着的未能达到6个,而是采用了另一条长的,是不是意味着白挖了。。

举例来说,字符串123的 Hash 是a8fdc205a9f19cc1c7507a60c4f01b13d11d7fd0(十六进制),转成二进制就是256位,而且只有123能得到这个 Hash。

而且只有123能得到这个 Hash。

这句话是错的。很多字符串都能得到这个hash,但是他们之间差异很大。

传闻黑客攻击了比特币,很好奇是怎么做到的?

期待阮先生精彩文章。尤其是现在以bitshare和steemit为代表的DPOS机制,在实时性能和处理能力方面已有很大进步。

分叉还是不大懂。

@EricJin:

怎么理解他们之间的差异很大啊?

文中对hash值的描述有误,不同的字符串存在hash碰撞的可能性。

真正潜心搞区块链技术研究的没多少,都去炒币了。几乎零投入今年赚了十几万。可想而知币圈暴富了多少人吧。

确实目前来说使用区域链非常有限

引用EricJin的发言:

举例来说,字符串123的 Hash 是a8fdc205a9f19cc1c7507a60c4f01b13d11d7fd0(十六进制),转成二进制就是256位,而且只有123能得到这个 Hash。

而且只有123能得到这个 Hash。

这句话是错的。很多字符串都能得到这个hash,但是他们之间差异很大。

你这个很多字符串说得真是张口就来。

阮老师说“只有123能得到这个Hash”确实不准确。
理论上任何哈希函数都不能避免哈希碰撞(冲突),设计较好的哈希函数只是将碰撞(冲突)的概率降到了很低,所以并不能说“只有”。
而所谓的“很多字符串”,其实也没那么多啦,只是理论上样本无穷大的时候必然存在碰撞(冲突)。

引用EricJin的发言:

举例来说,字符串123的 Hash 是a8fdc205a9f19cc1c7507a60c4f01b13d11d7fd0(十六进制),转成二进制就是256位,而且只有123能得到这个 Hash。

而且只有123能得到这个 Hash。

这句话是错的。很多字符串都能得到这个hash,但是他们之间差异很大。

别咬文嚼字了。谁还不知道hash 有冲突。

期待下篇

言简意赅,把复杂的道理说到本质而通俗,抽象总结能力大赞~

区块链的应用可以渗透到非常多的行业,合同,税收,财产公示(可以含私隐的公示),防伪,交易,选举,信用体系…等等,这些都只是本人想到的,其实也还有更多地方可以去应用,而比特币(泛指去中心加密数字货币)主要应用了财产公示,交易…
Hash那有个说法是错误的,不过可以忽略不计,改一下也好…

引用nextzeus的发言:

传闻黑客攻击了比特币,很好奇是怎么做到的?

是因为攻击了著名的一些bitcoin钱包,很多bitcoin是存在这些网上钱包里的

还有不少疑问,希望懂的人给解释一下:

1.

区块头里有两个hash,一个是指向上一块的hash(应该是上一区块体的hash?),这个应该是已确定的。

另一个是即将要加入的区块自身的hash,这个hash从本身的内容计算得出(采矿)

既然“同一内容,hash出来的值”是一样的,那就意味着,区域在加入链之前,内容是不确定的?

不知道这样理解对不对: 区块先生成必要的数据(比如 A转帐给B多少),然后加上会变化的"随机数",来算hash,算出来满足后,就加到链上。如果是这样,这个“随机数”一般是什么?

2. 区块的数据格式有约定吗

阮老师怎么看矿工在这个生态里的作用

还是看阮老师的文章能够理解,哈哈

具体如何计算Block Hash https://www.jianshu.com/p/4187a7352769
阮老师要入坑了么

阮老师,你好,关于文章的第七点,难度系数的动态调节这个章节里面的难度系数越调越高这句话怎么理解?请详细的解释一下,感谢。其中的动态调节我是理解,不理解的是为什么难度系数会越调越高。

区块包含上一个区块的哈希(即上一个区块的哈希),本区块的哈希。这样理解正确吗?

搜了一下网上的其它文章,加深了了解:

1.本区块的hash,是用区块头来计算,然后区块头会有一个随机数(nouce)来难度值来证明工作量

2.比特币的区块头里有个32字节的Merkle的Root hash来验证区块体里数据

引用EricJin的发言:

举例来说,字符串123的 Hash 是a8fdc205a9f19cc1c7507a60c4f01b13d11d7fd0(十六进制),转成二进制就是256位,而且只有123能得到这个 Hash。

而且只有123能得到这个 Hash。

这句话是错的。很多字符串都能得到这个hash,但是他们之间差异很大。

您说的"很多字符串都能得到这个hash,但是他们之间差异很大。"怎么理解,
是这个hash值被123占有之后, 所有字符串都能知道这个hash被占有了?还是123有了这个hash的同时,其他字符串比如234也能申请一个同样的hash?

这两个问题后者应该是不对的吧, 如果是前者,这不正是作者表达的吗?还是有更深层次的意义我没有领悟到,小白,望解答.

牵一发而动全身, 真的动了的话, 确实需要巨大的能量

实际上,有无限多的字符串能得到同一个hash,但是,碰撞的概率相当低。
区块链的应用场景除了密码学货币,更重要的,还有以太坊的智能合约。

最好懂的区块链教程

在有限长度的字符串中,hash可以认为不会碰撞。

要碰撞的字符串会长到现有的存储空间无法存放,所以暂时可以认为不会碰撞

引用顾唐散人的发言:

文中对hash值的描述有误,不同的字符串存在hash碰撞的可能性。

hash碰撞那是sha1和md5,sha256你碰一个给我试试

一张添加下一级速度很慢的链表

nonce值不一定是HASH重算的次数啊,因为矿工不一定从1开始递增去碰nonce值。

针对最后的总结部分。
老师说的主要是关于公有链的一些特点和需要。事实上现在区块链的商业应用上主要是同盟链与私有链。适应的场景与公有链区别非常大。

有几个问题想问一下。
1.第四点中说到一个区块改变自己的内容后面的区块会丢失这个区块的指针,结合"六次确认"的理论,所以区块链的结构我理解很有可能是这样的:
a b c
| | |
1--2--3--4--5--6--7--8--9--10--。。。
| | |
d e g
对吗?
2.全文都没有怎么提区块的内容是什么,但还是很在意,看本文所引用图片好像是数据交换记录,也就是比特币交易记录,那么没有交易发生时内容存的是什么?

可以看看这篇文章,精通比特币,很详细!
http://zhibimo.com/read/wang-miao/mastering-bitcoin/index.html

引用Kalay的发言:

您说的"很多字符串都能得到这个hash,但是他们之间差异很大。"怎么理解,
是这个hash值被123占有之后, 所有字符串都能知道这个hash被占有了?还是123有了这个hash的同时,其他字符串比如234也能申请一个同样的hash?

这两个问题后者应该是不对的吧, 如果是前者,这不正是作者表达的吗?还是有更深层次的意义我没有领悟到,小白,望解答.

hash是一种算法,根据你的输入计算出定长的输出,他说的意思是除了“123”能计算出“ a8fdc205a9f19cc1c7507a60c4f01b13d11d7fd0”,还有可能存在其它的字符串能计算得出“ a8fdc205a9f19cc1c7507a60c4f01b13d11d7fd0”的值,这叫"HASH碰撞",具体是哪个值或者说有没有都是不确定的,只是一种理论上的可能存在

引用shooter的发言:

具体如何计算Block Hashhttps://www.jianshu.com/p/4187a7352769
阮老师要入坑了么

这个很清楚,谢谢。
我理解是不是,区块体的内容是已经确定了。
然后大家来找一个 随机数,把已确定的区块体加上随机数之后,进行连续两次hash操作。
然后算出来的 hash值,前N位为0 才满足要求。

不错,期待下一篇关于比特币的介绍

有个地方想不明白:
如果挖矿就相当于找到一个新的满足条件的区块,那么一个区块就相当于一个比特币,那比特币赏金又是什么意思哦?(2009年比特币诞生的时候,每笔赏金是50个比特币;当总量达到1050万时,赏金减半为25个;当总量达到1575万,赏金再减半为12.5个)

找到一个新区块(序列)到底可以拿到多少个比特币?如果可以拿到多个,这多个又是怎么来的?

我是一个前端新手,现在的我很迷茫,想要强化自己,但是又不知道该学些什么,总感觉在一些做JAVA之类比较强的语言人面前很弱,现在人工智能什么的很火,我也想慢慢了解是什么,总之就是想学一个强语言,感觉现在过得很颓废,比较向往那种很积极向上的工作环境,例如创业公司那种拼搏氛围,现在年轻不想过得那么平庸,望各位大神给我点亮一站指明灯,万分感谢

@理想三旬:

习惯就好,不用去纠结什么强语言,没人知道

区块头中包含区块体的 Hash,如果一个区块的实际数据发生了改变,那么区块体的 Hash 就会发生改变,这一改变会导致当前区块的区块头发生改变,从而使得区块的 Hash 发生改变,当前区块的 Hash 发生改变又会引起下一个区块的区块头发生改变。如此一来,产生了骨牌效应。

修改一个区块时,如果不能同时修改后面所有的区块,就会导致当前区块与后面的区块失去连接。所以合适的做法就是不去修改区块。可是万一就有人非要去修改区块该怎么办呢?上面提到的这种联动机制看起来只会使得修改区块后果严重,并不能阻止修改区块的行为。

举例来说,字符串123的 Hash 是a8fdc205a9f19cc1c7507a60c4f01b13d11d7fd0(十六进制),转成二进制就是256位,而且只有123能得到这个 Hash。
'a8fdc205a9f19cc1c7507a60c4f01b13d11d7fd0'.length
40
40位16进制转换成2进制是160位吧
40位对应的是SHA1的算法

是不是有了量子计算机后就无视了,所以。。

到底是区块头hash还是区块体hash,一会区块体一会区块头

hash是针对原始内容吧,值应该是固定的?为啥还能有满足条件的某个hash值?只是内容可以随便指定?

感兴趣可以去听听这两集中文博客:

82.聊聊比特币背后的技术和Blockchain
http://teahour.fm/2015/12/27/talk-with-jan-about-bitcoin-and-blockchain.html

83.这次我们聊聊超酷的Ethereum
http://teahour.fm/2016/01/19/talk-with-jan-about-ehtereum.html

虽然现在的趋势是公有链,但对于很多项目来说,其实私有链和联盟链更适合。所以个人拙见,并不能说区块链的应用场景只有加密货币,而且,去中心化和中心化可以互补的,这样应用场景就更广了

我自己整理了一部分区块链的好文和工具,分享给大家 https://bitcoincash.best/wiki
里面有区块链的基础知识 比特币的基础知识科普和误解 区块链现在的应用情况 分叉币的讨论
当然也有部分技术讨论
欢迎大家阅读 更欢迎大家的分享

作者似乎把区块链和比特币混为一谈了。

引用nextzeus的发言:

传闻黑客攻击了比特币,很好奇是怎么做到的?

你指的应该是攻击了比特币的交易所,就相当于抢银行吧。

@soul:

区块内存的是比特币的交易记录。如果没有发生交易,区块内容可以为空。

阮老师,您好,我是一名高中生,由于研究课需要,我在网上查到了贝叶斯算法,并且看到了您的日志。可能由于网的问题,您的日志中的部分图片加载不出,我想如果您有空的话,是否可以直接发给我一份?

有人做个了区块链的Demo https://anders.com/blockchain/ 形象直接

我比较好奇的是,分支之后那个区块会被怎么操作?丢弃么?

新的区块是如何同步的呢?如果同步的过程中是无法产生新的区块吗?

反对《熵:宇宙的终极规则》中的世界观。
热力学第二定律是一个观察的结果,是一个热力学适用的定律。
宇宙中太多太多违背人们逻辑的存在,没有任何定律能够完全在宇宙的尺度下经历了严格的考验。量子力学越来越被验证不过是时间短而已,一如当初的牛顿力学,电磁学。
更何况有 刘维尔极力反对,导致了庞加莱回归定理的诞生。
庞加莱回归:
孤立的、有限的保守动力学系统在有限的时间内回复到任意接近初始组态的组态。
如果宇宙是有限的离散动力系统,那就不是“任意接近”,而是完全回到初始状态了。
就是一切都是轮回。

还有这些研究都不适用于智慧生命。人类目前的研究连自行车为啥不倒都搞不明白,离弄清楚智慧差太多太多。

感谢作者的电子书《未来世界的幸存者》看的真过瘾。一口气读完。

引用Nameless的发言:


你这个很多字符串说得真是张口就来。

不是很多,准确的说应该是无数。

而且可以保证,只要原始内容不同,对应的 Hash 一定是不同的。

这句话就不对,任何hash都不能保证,因为原始内容是无穷的,hash是有限的字符串。所以原始内容和hash必定是多对1的。

Hash 的有效性跟目标值密切相关,只有小于目标值的 Hash 才是有效的,否则 Hash 无效,必须重算。由于目标值非常小,Hash 小于该值的机会极其渺茫,可能计算10亿次,才算中一次。

——————————前面不是说,Hash是唯一的吗?为什么会算出来那么多?

引用EricJin的发言:

举例来说,字符串123的 Hash 是a8fdc205a9f19cc1c7507a60c4f01b13d11d7fd0(十六进制),转成二进制就是256位,而且只有123能得到这个 Hash。

而且只有123能得到这个 Hash。

这句话是错的。很多字符串都能得到这个hash,但是他们之间差异很大。

是这样. 可以这么说: 123 的 hash 值肯定是a8fdc205a9f19cc1c7507a60c4f01b13d11d7fd0, 如果数据的 hash 值不是a8fdc205a9f19cc1c7507a60c4f01b13d11d7fd0,那它一定不是123. 这样就可以知道数据是否被修改.

等到比特币将中本聪快要变成世界首富的时候,比尔盖茨控制windows系统在同一时间检测每台机有没有比特币区块,有的话就写入一个假账。其实一个全球都在用的软件就能够摧毁这个分布式账本。

写的很好。一点建议:可否考虑把「四、 Hash 的不可修改性」里的「历史」换成「事实」。
历史:不唯一。
事实:唯一。

Nonce并光是记录次数,每次重新计算 Hash 之所以会变就是因为 Nonce 不一样。所以计算的过程就是从1递增Nonce 找到合适的 Nonce 算出 Hash 能够满足条件。

如果故意修改某个区块,是否这个区块和他后面的区块链都脱离了?

引用hc的发言:

阮老师,你好,关于文章的第七点,难度系数的动态调节这个章节里面的难度系数越调越高这句话怎么理解?请详细的解释一下,感谢。其中的动态调节我是理解,不理解的是为什么难度系数会越调越高。

可以这样理解,假设矿机越来越多,如果难度系数不变,那挖到一个矿的时间会变短,那么2016个矿之后,难度系数就会由于平均时间变短(小于10分钟)而提升。

这个难度系统是系统设计时就已经集成了这个功能?会动态调整? 还是说现在中本聪会监控干预调整?

比特币的价值何在

看了好多区块链的介绍、入门、教程,感觉阮老师的文章是(从技术角度)讲的最清晰易懂的,别的好多文章要么虚无缥缈要么莫名其妙,让人看着摸不着头脑,哈哈:)

第五章有个疑问,除了用大量的计算能减缓新区块的添加速度,真的没有其他方案了吗?从成本的角度考虑,这种几乎绝对能让人可信的“数据库”代价是不是太大了点。。

引用okevin的发言:

Hash 的有效性跟目标值密切相关,只有小于目标值的 Hash 才是有效的,否则 Hash 无效,必须重算。由于目标值非常小,Hash 小于该值的机会极其渺茫,可能计算10亿次,才算中一次。

——————————前面不是说,Hash是唯一的吗?为什么会算出来那么多?

因为,比特币的挖矿,其实是在猜数字, (上一区块的信息)+ 随机数 生成的 hash, 符合前面连续出现N个0才算成功。所以,每个矿机都在猜什么样的随机数,才能达到要求

顺便说一下,hash有很多种算法,作者举例的hash,其实是 hash 中的一种算法,叫做 sha1
在 linux 控制台运行 echo "123" | sha1sum
就可以得到 a8fdc205a9f19cc1c7507a60c4f01b13d11d7fd0

但实际上,计算的是 "123\n" 的值,因为echo 输出包含了换行符的。
单纯 "123" 的 sha1 值应该是
202CB962AC59075B964B07152D234B70

我也是奇怪为啥会出现不一致去搜索了一下,才找到别人的这个解答

引用千帆万桅的发言:

修改一个区块时,如果不能同时修改后面所有的区块,就会导致当前区块与后面的区块失去连接。所以合适的做法就是不去修改区块。可是万一就有人非要去修改区块该怎么办呢?上面提到的这种联动机制看起来只会使得修改区块后果严重,并不能阻止修改区块的行为。

所以,比特币白皮书的方案,是从成本上避免这个的。

1.他要去改某个时刻开始,到后面所有的区块,那么后面的区块越多,他要算的就越多。 这要求他有十分强大的算力。
大约是需要全比特币网中 51% 以上的算力。

2.他要得到如此大的算力,需要付出很大的成本。 如果他改区块链账本得不到这么多收益,那么做这件事他得不偿失。

3.就算他无论如何也要给作假,改出假账本,让自己活得巨量比特币。 但这件事本身会导致比特币的信任度降低,使比特币失去价值

引用问天玄铁的发言:

等到比特币将中本聪快要变成世界首富的时候,比尔盖茨控制windows系统在同一时间检测每台机有没有比特币区块,有的话就写入一个假账。其实一个全球都在用的软件就能够摧毁这个分布式账本。

做假账,也要计算的啊。而且因为主链是一条完整的,前后可以验证的。所以,没法去改很久之前的记录。这意味着,你要把全世界算几年的所有东西,瞬间全部算出来?

你去改最新的数据,给某个账户加钱,那么,钱从哪来? 每个挖矿的都可以查所有账单记录,钱不可能凭空转给你。
你在不知道别人密钥的情况下, 也不能伪造 别人给你转钱的数据

引用jackcai的发言:

这个难度系统是系统设计时就已经集成了这个功能?会动态调整? 还是说现在中本聪会监控干预调整?

系统设计时就已经集成了这个功能。比特币现在基本全靠开始就设计好的思路在运行。 而现在出现比特币交易拥堵,确认越来越慢,这也是当初没有意料到的。 为了解决这问题,所以大家全体(矿工和核心代码维护者等)经过反复权衡和分裂,才分叉出比特币现金 BCH。

文章中出现错误:
`a8fdc205a9f19cc1c7507a60c4f01b13d11d7fd0`换成2进制是160,明显是sha1算法算出来的
而且123的sha1值为`40bd001563085fc35165329ea1ff5c5ecbdbbeef`
根据上面留言的提示,`123\n`的sha1值为a8fdc205a9f19cc1c7507a60c4f01b13d11d7fd0

123的sha256值为181210f8f9c779c26da1d9b2075bde0127302ee0e3fca38c9a83f5b1dd8e5d3b

引用nextzeus的发言:

传闻黑客攻击了比特币,很好奇是怎么做到的?

攻击比特币本身没做到,只是攻击比特币平台,就像一个保险箱里放着美金,黑客攻击的是保险箱,美金本身还安全,攻击成功也就是从保险箱的美金拿出来而已,目前还做不到印假钞

我想知道中本聪是怎么做到动态调整难度系数的, 没有中心,他是怎么做到要求大家都遵守他动态调节难度系数这个规则的?

@一地风飞:

同样的疑惑, 相同的区块体,计算出来的hash值不是唯一的么? 为什么可以重算很多次?

另外一个问题, 每一笔交易,都独占一个区块么?

@张鹏 有变量 就是 nonce 这个随机数 因为生成的 hash 要达到一定标准才被承认 所以要不断变化 nonce 去碰出一个符合要求的随机数 一个区块上的交易数大于等于一 具体多少由矿工决定 因为每笔交易是带交易费的 交易费根据交易发起人自己设定有多有少 矿工有权选择交易费多的 因此交易费多的更早被打包到区块链

引用John的发言:

@张鹏 有变量 就是 nonce 这个随机数 因为生成的 hash 要达到一定标准才被承认 所以要不断变化 nonce 去碰出一个符合要求的随机数 一个区块上的交易数大于等于一 具体多少由矿工决定 因为每笔交易是带交易费的 交易费根据交易发起人自己设定有多有少 矿工有权选择交易费多的 因此交易费多的更早被打包到区块链

这个讲的通,谢谢

看了一圈都是英文文字,很難得有國人寫出來。期待著這個系列不斷更新!!加油

感谢博主的无私分享。文章写的非常好,我反复看了好几遍,以下是我的一些疑问向您请教一下:
1、区块的计算是持续的,无论网络上面是否有交易都会计算并产生新的区块。因此第一个区块内应该是没有包含任何交易信息的,第一枚比特币是生产第一个区块是奖励给矿工产生的?

2、比特币网络中的节点指的是矿工,而不是在网络上交易比特币的普通用户?

3、需要消耗大量的算力才能产生一个新的区块,目的是为了保证比特币的安全,因此比特币区块链这个算力的设计即是它的优点也是它的硬伤?

4、目前是每产生一个新的区块奖励12.5个比特币,当前市价100多万人民币,如果这个区块包含的所有交易总量只有1个比特币,那么这个奖励和这个交易本身相比是否太高了?这个交易费用和大量消耗的算力是否会成为制约比特币的致命问题?

5、比特币算力日益集中,有没有可能几个矿场联合起来拥有超过51%的算力?

通俗易懂

这矿场配图不会是宝二爷吧。。。

「这意味着,如果当前区块的内容变了,或者上一个区块的 Hash 变了,一定会引起当前区块的 Hash 改变。」
这句话怎么理解呢?上一个区块的hash为什么会变呢?不是写入区块链就固定了么?

我觉得区块链的设计,还不是很完美,怎么说,就是感觉不是特别靠谱的那种。当然,也可能是我眼界窄
以这个为例
“现在的规则是,新节点总是采用最长的那条区块链。如果区块链有分叉,将看哪个分支在分叉点后面,先达到6个新区块(称为"六次确认")。按照10分钟一个区块计算,一小时就可以确认”
林子大了,什么鸟都有,万一不止一个人同时达到6个呢,该取谁?继续?那又万一有两个人同时计算出12个,怎么办呢?
有点想不通,求解

不是说区块链使用非常有限,而是靠POW工作量证明的共识体系的应用场景特别有限。工作量证明浪费资源,这一点不言而喻。所以才出现了如POS,BFT等其他的共识机制。只是目前POW在比特币上得到了很好的应用。要应用与其他场景,特别是非币圈的POW就不合适了,但还没有设计出其他完美的共识算法(规则),这也是区块链在除了数字货币都还在初期阶段的原因

又来误人子弟了

区块链和Git有什么相似的地方吗?

区块链的应用场景还是很多的,各种公链便是例证。区块链的应用其实包含币和链两方面。
结合智能合约技术,区块链更是可以产生无穷的想象空间。资产管理、国际支付、版权保护、防伪溯源,数不胜数。
互联网降低了信息传输的成本,而区块链将会降低信任的成本。个人还是比较看好区块链的。
只是区块链的不可控性,倒是对其发展有一定的限制,毕竟官方也不知道怎么来管理它。

文中提到的123的Hash值转化成二进制并不是236位呀,好像是140位?

我又一个问题,如果比较靠前的区块链发生了改变,后面的所有都要重新计算。
是不是交易记录写入后,就不会在改变了?新的交易记录只会在新的区块链被写入。
这也就是所谓历史发生了了就发生了,不能再被更改的意思。

文中说“举例来说,字符串123的 Hash 是a8fdc205a9f19cc1c7507a60c4f01b13d11d7fd0(十六进制),转成二进制就是256位”

这个hash才40位啊,转换为2进制后才160位。

引用hc的发言:

阮老师,你好,关于文章的第七点,难度系数的动态调节这个章节里面的难度系数越调越高这句话怎么理解?请详细的解释一下,感谢。其中的动态调节我是理解,不理解的是为什么难度系数会越调越高。

由于技术以及硬件的提升,算出区块的时间相应缩短了。根据动态调节规则,相应的难度系数会越调越高

`a8fdc205a9f19cc1c7507a60c4f01b13d11d7fd0`换成2进制是160,明显是sha1算法算出来的
而且123的sha1值为`40bd001563085fc35165329ea1ff5c5ecbdbbeef`
根据上面留言的提示,`123\n`的sha1值为a8fdc205a9f19cc1c7507a60c4f01b13d11d7fd0

这个留言是不对的,这个123的hash值并没有包括换行符在里面,是sha1本来就是160位的,等效为40位16进制数,而且以你自己的计算机算出来的123对应的sha1值,一定会跟文章中的一样,肯定是a8fdc205a9f19cc1c7507a60c4f01b13d11d7fd0,因为是处于同一个有限的数值空间中

我觉得区块链的设计,还不是很完美,怎么说,就是感觉不是特别靠谱的那种。当然,也可能是我眼界窄
以这个为例
“现在的规则是,新节点总是采用最长的那条区块链。如果区块链有分叉,将看哪个分支在分叉点后面,先达到6个新区块(称为"六次确认")。按照10分钟一个区块计算,一小时就可以确认”
林子大了,什么鸟都有,万一不止一个人同时达到6个呢,该取谁?继续?那又万一有两个人同时计算出12个,怎么办呢?
有点想不通,求解

时间的精度可以达到10E-18以上,这意味着基本不可能同时达到

@一地风飞:

同样的疑惑, 相同的区块体,计算出来的hash值不是唯一的么? 为什么可以重算很多次?


注意hash值是基于区块头算出来的,而每个区块头里有一个独一无二的值,生成时间.....
所以每个区块的hash值肯定不一样

这个留言是不对的,这个123的hash值并没有包括换行符在里面,是sha1本来就是160位的,等效为40位16进制数,而且以你自己的计算机算出来的123对应的sha1值,一定会跟文章中的一样,肯定是a8fdc205a9f19cc1c7507a60c4f01b13d11d7fd0,因为是处于同一个有限的数值空间中

修正一下错误,echo的确默认会有换行符在里面,可以使用echo -n '123' | sha1sum得到123真正的hash值,40bd001563085fc35165329ea1ff5c5ecbdbbeef,跟之前几位讲的一样

引用fogin的发言:

我想知道中本聪是怎么做到动态调整难度系数的, 没有中心,他是怎么做到要求大家都遵守他动态调节难度系数这个规则的?

你的这个提问真是提到关键点上了,在去中心化的环境中,到底是哪个角色负责调整这个动态难度系数,这个问题竟然没有大牛回答,我也想知道。。。

大大,我想问下为啥算出来的hash小于目标值就算是正确的

引用nextzeus的发言:

传闻黑客攻击了比特币,很好奇是怎么做到的?

攻击的是托管比特币钱包的平台,用户的私钥也是存储的那些平台的。

个人总结的一些前端数据结构预算法 http://blog.csdn.net/github_38851471/article/details/79159392

"而且可以保证,只要原始内容不同,对应的 Hash 一定是不同的。"

这句话会不会有问题? 哈希值相等,原内容可能不相等,可能出现哈希碰撞.

引用why的发言:

分叉还是不大懂。

就是在限定的时间里分叉的两个链条哪个最长就用哪条

如果hash是256位二进制值,那在257位任意组合的二进制值中就肯定存在hash相同的吧。。

有时间是否可以讲讲DAG?

如果github这么搞 估计网络要瘫痪了 呵呵哒

一直没想明白,如果挖出块时并没有交易可写,那么这个块体就是空吧,这样,如果再挖出一个,这个新块是不是接上一个空块,那么空块中以后也不能写入新内容了吧?交易在不停产生,块不够写怎么办?块的产生与交易本质上是异步的,怎么保证交易一定有块可写?

做运营的it小白路过,看了多天的区块链,这个真的是最好懂的。
ps:居然有自己的网页,崇拜ing~

引用Nameless的发言:

你这个很多字符串说得真是张口就来。

他说的没错,理论上讲,有无穷多

引用一地风飞的发言:

还有不少疑问,希望懂的人给解释一下:

1.

不知道这样理解对不对: 区块先生成必要的数据(比如 A转帐给B多少),然后加上会变化的"随机数",来算hash,算出来满足后,就加到链上。如果是这样,这个“随机数”一般是什么?

2. 区块的数据格式有约定吗


以自己的理解一个个回答吧

1. 一个chunk 的确有两个hash, 第一个是上个区块的hash , 第二个是经过挖矿计算得到的.

那么挖矿 的过程, 实际上是把当前区块的内容(有上个hash), 和一个随机数一起, 进行hash.

当然可以很轻松的得到一个值, 所以这里存在一个难度, 比如规定, 得到的hash 必须以000000(六个零开头)那么难度就会大大的增大(具体的要求和这个类似,所以存在难度系数).

一旦这行hash满足了要求, 那么立马全网广播 mined!

2是有固定格式的, 是json和十六进制数 https://webbtc.com , 用区块浏览器可以很轻松的看到

大约是人类历史上第一次出现了一个拖慢效率、浪费能源、99%以上的努力都只为努力本身的新技术大规模运用的实例了。。。是不是可以看做现有秩序体系在崩溃的一种象征?

区块链同步是什么意思?

看了那么多教程,最后还是这篇最清晰

"区块链作为无人管理的分布式数据库,从2009年开始已经运行了8年,没有出现大的问题。"

这其实应该是“比特币”,而不是区块链。这是两回事。

"区块链是一种特殊的分布式数据库 ... ... 主要作用是储存信息。任何需要保存的信息,都可以写入区块链,也可以从里面读取,所以它是数据库。"

这个表述我认为是有问题的,区块链不能称之为“数据库”,并不是可以存储数据就可以叫“数据库”的。

关于数据库的定义,在中文维基百科中如下定义,https://zh.wikipedia.org/wiki/%E6%95%B0%E6%8D%AE%E5%BA%93,“数据库 ... ...
用户可以对文件中的数据运行新增、截取、更新、删除等操作”。

在 webster 词典中定义如下,https://www.merriam-webster.com/dictionary/database,“数据库是一系列有组织的数据,特别用于快速查询和存取”。

首先,区块链可以新增数据,但是不具备“更新”和“删除”功能。其次,区块链可以存储数据,但是不具备“快速查询和存取“的功能。第三,广义上的区块链是可以存储任意数据,但是目前区块链实际应用最广泛的两个应用,比特币和以太坊,一个只能记录一系列输入和输出的数字,一个只能记录 token,最多是以附言的方式记录简短的一段信息,并不具备数据存储的实用性。

进一步的,考虑到区块链每个节点的都是存储了所有历史信息的这个特点,利用区块链来存储大量数据也是非常不切实际的。

引用strickland的发言:

不是很多,准确的说应该是无数。

但是你在有生之年就是找不到

引用ghoulich的发言:

你的这个提问真是提到关键点上了,在去中心化的环境中,到底是哪个角色负责调整这个动态难度系数,这个问题竟然没有大牛回答,我也想知道。。。

动态难度系数的调整就是代码里面的逻辑,因为所有节点运行的客户端程序都一样,所以没有那个角色负责调整难度系数。当然调整难度系数也是可以做到的,首先要通过比特币社区的提案,然后开发出新的版本就可以。

您好,我有一个疑问,如果有人恶意修改当前区块的内容,然后区块失效,这个区块丢失之后,会不会导致当前区块的内容丢失呢?这个内容已经备份到所有的区块里面了吗?

还有一个问题就是后面链接的所有区块都得修改,否则以后所有的区块都断掉了,这个区块里面的内容究竟是全量的,所有区块都相同的,还是只保存当前操作的

“每个区块的 Hash 都是针对"区头"(Head)计算的”


跟下文联系 表达不清楚. 所谓上一block的hash究竟是仅用上一block head生成的, 还是上一block整体直接生成的?

没讲清楚为什么采矿时会不断算出来不同的hash,什么是变量。对已经确定的上一个block求hash 结果是唯一的。

引用EricJin的发言:

举例来说,字符串123的 Hash 是a8fdc205a9f19cc1c7507a60c4f01b13d11d7fd0(十六进制),转成二进制就是256位,而且只有123能得到这个 Hash。

而且只有123能得到这个 Hash。

这句话是错的。很多字符串都能得到这个hash,但是他们之间差异很大。

--这个是hash碰撞对吗?

@一地风飞:

随机数就是区块数据中的Nonce值

这个区块链让我看见了神经元的运作,怕是区块链可以加速人工智能的发展甚至直接衍生AI

引用Nameless的发言:

你这个很多字符串说得真是张口就来。

他说的还真没错,确实有很多字符串,或者说这个数字是无穷大。从任意位数到这个256位的有限映射,要说和“123”这个冲突的字符串,不是很多是什么呢?只是很难找到,差异很大罢了,这点他也提到了。

我要发表看法

«-必填

«-必填,不公开

«-我信任你,不会填写广告链接