bomblab-writeup

前言

《CSAPP》一书的Bomb实验是为了让读者了解一下汇编的基本知识，以及对gdb的基本使用。在这个过程中可以巩固，高级语言如C语言的代码在机器级别是怎么表示的，那些控制语句、循环语句、判断语句等都呈现怎样的规律。

Bomb实验有好几关，只有每一关都输入正确的指令才能够进入下一关，任何一步输入错误都会导致Bomb“爆炸”。接下来就从第一关开始，一点点拆开这个“Bomb”。

在下载了题目压缩包之后，打开竟然看到一个.c的源码文件，当打开想看一下源码的时候，才发现最后被嘲笑了。所以，还是踏踏实实，一点一点完成吧。

Phase_1

首先，通过命令objdump -d bomb得到可执行文件的反汇编代码，先看一下phase_1部分的代码。

0000000000400ee0 <phase_1>:
  400ee0:	48 83 ec 08          	sub    $0x8,%rsp
  400ee4:	be 00 24 40 00       	mov    $0x402400,%esi
  400ee9:	e8 4a 04 00 00       	callq  401338 <strings_not_equal>
  400eee:	85 c0                	test   %eax,%eax
  400ef0:	74 05                	je     400ef7 <phase_1+0x17>
  400ef2:	e8 43 05 00 00       	callq  40143a <explode_bomb>
  400ef7:	48 83 c4 08          	add    $0x8,%rsp
  400efb:	c3                   	retq

第一部分就是热身，将输入的字符串与一个固定的字符串进行比较，这个固定字符串的地址为0x402400。

使用gdb调试bomb，在gdb中使用break phase_1下断点到函数phase_1，然后输入“r”运行，随便输入一个字符串，便会停到phase_1开始执行的地方，使用命令x/s 0x402400来查看这个地址的字符串是什么，我所得到的是：Border relations with Canada have never been better。接下来退出gdb，重新运行输入正确的字符串通过phase_1，我们就可以继续往下走了。

Phase_2

看一下phase_2的反汇编代码：

0000000000400efc <phase_2>:
  400efc:	55                   	push   %rbp
  400efd:	53                   	push   %rbx
  400efe:	48 83 ec 28          	sub    $0x28,%rsp
  400f02:	48 89 e6             	mov    %rsp,%rsi
  400f05:	e8 52 05 00 00       	callq  40145c <read_six_numbers>
  400f0a:	83 3c 24 01          	cmpl   $0x1,(%rsp)
  400f0e:	74 20                	je     400f30 <phase_2+0x34>
  400f10:	e8 25 05 00 00       	callq  40143a <explode_bomb>
  400f15:	eb 19                	jmp    400f30 <phase_2+0x34>
  400f17:	8b 43 fc             	mov    -0x4(%rbx),%eax
  400f1a:	01 c0                	add    %eax,%eax
  400f1c:	39 03                	cmp    %eax,(%rbx)
  400f1e:	74 05                	je     400f25 <phase_2+0x29>
  400f20:	e8 15 05 00 00       	callq  40143a <explode_bomb>
  400f25:	48 83 c3 04          	add    $0x4,%rbx
  400f29:	48 39 eb             	cmp    %rbp,%rbx
  400f2c:	75 e9                	jne    400f17 <phase_2+0x1b>
  400f2e:	eb 0c                	jmp    400f3c <phase_2+0x40>
  400f30:	48 8d 5c 24 04       	lea    0x4(%rsp),%rbx
  400f35:	48 8d 6c 24 18       	lea    0x18(%rsp),%rbp
  400f3a:	eb db                	jmp    400f17 <phase_2+0x1b>
  400f3c:	48 83 c4 28          	add    $0x28,%rsp
  400f40:	5b                   	pop    %rbx
  400f41:	5d                   	pop    %rbp
  400f42:	c3                   	retq

从调用函数read_six_numbers就可以看出这一关是需要输入六个数字，如果想再确认一下，可以继续看该函数的反汇编代码。读到的6个数字存储的地址首地址存储在rsp寄存器中，所以(rsp)表示的就是第一个数字。首先第一个数字必须是1，这样跳转到地址0x400f30，取出第二个数字存到寄存器rbx，将最后一个数字之后的地址存放在寄存器rbp中（作为边界），跳转到地址0x400f17，取第一数字，乘以2（自己加自己），然后与第二个数字比较，需要相等，那么第二个数字就是2。接下来是循环，后面的数字都是前面数字的2倍。所以最终的结果是：1 2 4 8 16 32。

Phase_3

首先看phase_3的反汇编代码：

0000000000400f43 <phase_3>:
  400f43:	48 83 ec 18          	sub    $0x18,%rsp
  400f47:	48 8d 4c 24 0c       	lea    0xc(%rsp),%rcx
  400f4c:	48 8d 54 24 08       	lea    0x8(%rsp),%rdx
  400f51:	be cf 25 40 00       	mov    $0x4025cf,%esi
  400f56:	b8 00 00 00 00       	mov    $0x0,%eax
  400f5b:	e8 90 fc ff ff       	callq  400bf0 <[email protected]>
  400f60:	83 f8 01             	cmp    $0x1,%eax
  400f63:	7f 05                	jg     400f6a <phase_3+0x27>
  400f65:	e8 d0 04 00 00       	callq  40143a <explode_bomb>
  400f6a:	83 7c 24 08 07       	cmpl   $0x7,0x8(%rsp)
  400f6f:	77 3c                	ja     400fad <phase_3+0x6a>
  400f71:	8b 44 24 08          	mov    0x8(%rsp),%eax
  400f75:	ff 24 c5 70 24 40 00 	jmpq   *0x402470(,%rax,8)
  400f7c:	b8 cf 00 00 00       	mov    $0xcf,%eax
  400f81:	eb 3b                	jmp    400fbe <phase_3+0x7b>
  400f83:	b8 c3 02 00 00       	mov    $0x2c3,%eax
  400f88:	eb 34                	jmp    400fbe <phase_3+0x7b>
  400f8a:	b8 00 01 00 00       	mov    $0x100,%eax
  400f8f:	eb 2d                	jmp    400fbe <phase_3+0x7b>
  400f91:	b8 85 01 00 00       	mov    $0x185,%eax
  400f96:	eb 26                	jmp    400fbe <phase_3+0x7b>
  400f98:	b8 ce 00 00 00       	mov    $0xce,%eax
  400f9d:	eb 1f                	jmp    400fbe <phase_3+0x7b>
  400f9f:	b8 aa 02 00 00       	mov    $0x2aa,%eax
  400fa4:	eb 18                	jmp    400fbe <phase_3+0x7b>
  400fa6:	b8 47 01 00 00       	mov    $0x147,%eax
  400fab:	eb 11                	jmp    400fbe <phase_3+0x7b>
  400fad:	e8 88 04 00 00       	callq  40143a <explode_bomb>
  400fb2:	b8 00 00 00 00       	mov    $0x0,%eax
  400fb7:	eb 05                	jmp    400fbe <phase_3+0x7b>
  400fb9:	b8 37 01 00 00       	mov    $0x137,%eax
  400fbe:	3b 44 24 0c          	cmp    0xc(%rsp),%eax
  400fc2:	74 05                	je     400fc9 <phase_3+0x86>
  400fc4:	e8 71 04 00 00       	callq  40143a <explode_bomb>
  400fc9:	48 83 c4 18          	add    $0x18,%rsp
  400fcd:	c3                   	retq

这段代码看着比较长，首先调用sscanf将输入的字符串做格式化处理，提取出两个值，地址0x4025cf存放的的字符串为“%d %d”，说明是两个整形，分别存放在内存(%rsp+0x8)（第一个数)和(%rsp+0xc)（第二个数）中。

第一个数不能大于7，后面的部分其实是一个switch语句（参考网络），根据第一个数，将第二个数与对应的数字比较，相等才可以通过。所以这一关的答案不唯一。在gdb中查看*0x402470(,%rax,8)根据rax值（也就是第一个数）的不同分别指向不同的地址：0对应0x400f7c，1对应0x400fb9，2对应0x400f83，3对应0x400f8a，4对应0x400f91，5对应0x400f98，6对应0x400f9f，7对应0x4400fa6。这些地址所对应的第二个数应该值对应关系为：（0 207）、（1 311）、（2 707）、（3 256）、（4 389）、（5 206）、（6 682）、（7 327），这些数对任意一组就是这一关的解答。

Phase_4

依然先看一下反汇编代码：

000000000040100c <phase_4>:
  40100c:	48 83 ec 18          	sub    $0x18,%rsp
  401010:	48 8d 4c 24 0c       	lea    0xc(%rsp),%rcx
  401015:	48 8d 54 24 08       	lea    0x8(%rsp),%rdx
  40101a:	be cf 25 40 00       	mov    $0x4025cf,%esi
  40101f:	b8 00 00 00 00       	mov    $0x0,%eax
  401024:	e8 c7 fb ff ff       	callq  400bf0 <[email protected]>
  401029:	83 f8 02             	cmp    $0x2,%eax
  40102c:	75 07                	jne    401035 <phase_4+0x29>
  40102e:	83 7c 24 08 0e       	cmpl   $0xe,0x8(%rsp)
  401033:	76 05                	jbe    40103a <phase_4+0x2e>
  401035:	e8 00 04 00 00       	callq  40143a <explode_bomb>
  40103a:	ba 0e 00 00 00       	mov    $0xe,%edx
  40103f:	be 00 00 00 00       	mov    $0x0,%esi
  401044:	8b 7c 24 08          	mov    0x8(%rsp),%edi
  401048:	e8 81 ff ff ff       	callq  400fce <func4>
  40104d:	85 c0                	test   %eax,%eax
  40104f:	75 07                	jne    401058 <phase_4+0x4c>
  401051:	83 7c 24 0c 00       	cmpl   $0x0,0xc(%rsp)
  401056:	74 05                	je     40105d <phase_4+0x51>
  401058:	e8 dd 03 00 00       	callq  40143a <explode_bomb>
  40105d:	48 83 c4 18          	add    $0x18,%rsp
  401061:	c3                   	retq

通过gdb分析，还是需要从字符串中解析出来两个整型数字，分别存储在(%rsp+0x8)和(%rsp+0xc)两个内存单元中。第一个数字必须小于等于0xe，即十进制的14，然后将14存入寄存器edx，0存入esi，将第一个数字存入寄存器edi，这三个值作为函数func4的参数并调用该函数，函数返回值需为0。在这段代码最后要比较第二个数字是否等于0，不等于0就要“爆炸”，所以现在可以确定第一个数字要小于等于14，第二个数为0。

这里稍微提一下x86_64函数调用的参数顺序，前六个参数可以存放在寄存器中，后面更多的参数压栈，六个寄存器与参数对应的顺序如下图：

然后看一下函数func4的内容：

0000000000400fce <func4>:
  400fce:	48 83 ec 08          	sub    $0x8,%rsp
  400fd2:	89 d0                	mov    %edx,%eax
  400fd4:	29 f0                	sub    %esi,%eax
  400fd6:	89 c1                	mov    %eax,%ecx
  400fd8:	c1 e9 1f             	shr    $0x1f,%ecx
  400fdb:	01 c8                	add    %ecx,%eax
  400fdd:	d1 f8                	sar    %eax
  400fdf:	8d 0c 30             	lea    (%rax,%rsi,1),%ecx
  400fe2:	39 f9                	cmp    %edi,%ecx
  400fe4:	7e 0c                	jle    400ff2 <func4+0x24>
  400fe6:	8d 51 ff             	lea    -0x1(%rcx),%edx
  400fe9:	e8 e0 ff ff ff       	callq  400fce <func4>
  400fee:	01 c0                	add    %eax,%eax
  400ff0:	eb 15                	jmp    401007 <func4+0x39>
  400ff2:	b8 00 00 00 00       	mov    $0x0,%eax
  400ff7:	39 f9                	cmp    %edi,%ecx
  400ff9:	7d 0c                	jge    401007 <func4+0x39>
  400ffb:	8d 71 01             	lea    0x1(%rcx),%esi
  400ffe:	e8 cb ff ff ff       	callq  400fce <func4>
  401003:	8d 44 00 01          	lea    0x1(%rax,%rax,1),%eax
  401007:	48 83 c4 08          	add    $0x8,%rsp
  40100b:	c3                   	retq

大概可以看出这是一个递归调用的函数，我们可以尝试写出它的高级语言伪代码：

edx = 14, esi = 0, edi = input1;
func4(edx, esi, edi)
{
	ecx = (edx - esi) / 2 + rsi;
	
	if (ecx <= edi) {
		eax = 0;
		if (ecx < edi) {
			esi = rcx + 1;
			return 2 * func4(edx, esi, edi) + 1;
		} else {
			return eax;
		}
	} else {
		edx = rcx - 1;
		return 2 * func4(edx, esi, edi);
	}
}

根据上面的伪代码很容易就可以看出来，需要计算出来的ecx等于edi就可以，初始化的edx=14，esi=0，那么计算出来的ecx就等于7，所以可以输入第一个数字为7，其他的可能值或许可以试试这个递归函数能否算出来，我怕麻烦就免了吧。由第二个数字必需为0，那我们就可以得到一组答案为“7 0”，经验证是正确的。

这里对上面汇编代码翻译成伪代码做一点小说明：

开头的一段代码：

mov    %edx,%eax
sub    %esi,%eax
mov    %eax,%ecx
shr    $0x1f,%ecx
add    %ecx,%eax
sar    %eax

这就是将edx与esi之差除以2，但是其中考虑到了差为负数的情况，因为计算机中整型数字都是以补码的形式存放，负数如果直接右移一位，而且绝对值又不是2的倍数，结果就会变小，这种现象可以自己模拟一下。

最后递归的式子：eax或者rax存放的就是函数的返回值，直接将函数本身带入式子。

Phase_5

还是先看一下这一关的反汇编代码：

0000000000401062 <phase_5>:
  401062:	53                   	push   %rbx
  401063:	48 83 ec 20          	sub    $0x20,%rsp
  401067:	48 89 fb             	mov    %rdi,%rbx
  40106a:	64 48 8b 04 25 28 00 	mov    %fs:0x28,%rax
  401071:	00 00 
  401073:	48 89 44 24 18       	mov    %rax,0x18(%rsp)
  401078:	31 c0                	xor    %eax,%eax
  40107a:	e8 9c 02 00 00       	callq  40131b <string_length>
  40107f:	83 f8 06             	cmp    $0x6,%eax
  401082:	74 4e                	je     4010d2 <phase_5+0x70>
  401084:	e8 b1 03 00 00       	callq  40143a <explode_bomb>
  401089:	eb 47                	jmp    4010d2 <phase_5+0x70>
  40108b:	0f b6 0c 03          	movzbl (%rbx,%rax,1),%ecx
  40108f:	88 0c 24             	mov    %cl,(%rsp)
  401092:	48 8b 14 24          	mov    (%rsp),%rdx
  401096:	83 e2 0f             	and    $0xf,%edx
  401099:	0f b6 92 b0 24 40 00 	movzbl 0x4024b0(%rdx),%edx
  4010a0:	88 54 04 10          	mov    %dl,0x10(%rsp,%rax,1)
  4010a4:	48 83 c0 01          	add    $0x1,%rax
  4010a8:	48 83 f8 06          	cmp    $0x6,%rax
  4010ac:	75 dd                	jne    40108b <phase_5+0x29>
  4010ae:	c6 44 24 16 00       	movb   $0x0,0x16(%rsp)
  4010b3:	be 5e 24 40 00       	mov    $0x40245e,%esi
  4010b8:	48 8d 7c 24 10       	lea    0x10(%rsp),%rdi
  4010bd:	e8 76 02 00 00       	callq  401338 <strings_not_equal>
  4010c2:	85 c0                	test   %eax,%eax
  4010c4:	74 13                	je     4010d9 <phase_5+0x77>
  4010c6:	e8 6f 03 00 00       	callq  40143a <explode_bomb>
  4010cb:	0f 1f 44 00 00       	nopl   0x0(%rax,%rax,1)
  4010d0:	eb 07                	jmp    4010d9 <phase_5+0x77>
  4010d2:	b8 00 00 00 00       	mov    $0x0,%eax
  4010d7:	eb b2                	jmp    40108b <phase_5+0x29>
  4010d9:	48 8b 44 24 18       	mov    0x18(%rsp),%rax
  4010de:	64 48 33 04 25 28 00 	xor    %fs:0x28,%rax
  4010e5:	00 00 
  4010e7:	74 05                	je     4010ee <phase_5+0x8c>
  4010e9:	e8 42 fa ff ff       	callq  400b30 <[email protected]>
  4010ee:	48 83 c4 20          	add    $0x20,%rsp
  4010f2:	5b                   	pop    %rbx
  4010f3:	c3                   	retq

首先判断所输入字符串的长度必须为6，否则“爆炸”。长度判断通过，跳转到0x4010d2，然后将eax置零，跳转到地址0x40108b，进行下面的判断。

其实这一段判断是一个循环体，可以尝试写伪代码如下：

eax = 0;
for (; eax < 6; eax++) {
	rdx = rbx[rax] & 0xf;
	edx = *(0x4024b0 + rdx);
	*(rsp + rax + 0x10) = edx;
}
if [(rsp + 0x10) == 0x40245e]
	return 0;
else
	Bomb!

就是逐个判断所输入字符串的字符，将其解析成为整型，然后作为下标去起始地址为0x4024b0找到对应的字符，逐个存入到起始地址为rsp+0x10的字符串对应下标位置，最终将该拼成的字符串与起始地址为0x40245e的字符串进行比较。

起始地址为0x4024b0所存储的字符串为“maduiersnfotvbylSo you think you can stop the bomb with ctrl-c, do you?”，起始地址为0x40245e的字符串为“flyers”，这六个字母在前一个字符串中对应的下标分别为“9 15 14 5 6 7”，十六进制为“0x9 0xf 0xe 0x5 0x6 0x7”，在可打印字符中找出低四位是这六个的按次序输入即可，所以可以得到一组答案为“9ON567”，验证通过。

Phase_6

这是最后一关了，还是先看它的反汇编代码，这一关的代码比较长：

00000000004010f4 <phase_6>:
  4010f4:	41 56                	push   %r14
  4010f6:	41 55                	push   %r13
  4010f8:	41 54                	push   %r12
  4010fa:	55                   	push   %rbp
  4010fb:	53                   	push   %rbx
  4010fc:	48 83 ec 50          	sub    $0x50,%rsp
  401100:	49 89 e5             	mov    %rsp,%r13
  401103:	48 89 e6             	mov    %rsp,%rsi
  401106:	e8 51 03 00 00       	callq  40145c <read_six_numbers>
  40110b:	49 89 e6             	mov    %rsp,%r14
  40110e:	41 bc 00 00 00 00    	mov    $0x0,%r12d
  401114:	4c 89 ed             	mov    %r13,%rbp
  401117:	41 8b 45 00          	mov    0x0(%r13),%eax
  40111b:	83 e8 01             	sub    $0x1,%eax
  40111e:	83 f8 05             	cmp    $0x5,%eax
  401121:	76 05                	jbe    401128 <phase_6+0x34>
  401123:	e8 12 03 00 00       	callq  40143a <explode_bomb>
  401128:	41 83 c4 01          	add    $0x1,%r12d
  40112c:	41 83 fc 06          	cmp    $0x6,%r12d
  401130:	74 21                	je     401153 <phase_6+0x5f>
  401132:	44 89 e3             	mov    %r12d,%ebx
  401135:	48 63 c3             	movslq %ebx,%rax
  401138:	8b 04 84             	mov    (%rsp,%rax,4),%eax
  40113b:	39 45 00             	cmp    %eax,0x0(%rbp)
  40113e:	75 05                	jne    401145 <phase_6+0x51>
  401140:	e8 f5 02 00 00       	callq  40143a <explode_bomb>
  401145:	83 c3 01             	add    $0x1,%ebx
  401148:	83 fb 05             	cmp    $0x5,%ebx
  40114b:	7e e8                	jle    401135 <phase_6+0x41>
  40114d:	49 83 c5 04          	add    $0x4,%r13
  401151:	eb c1                	jmp    401114 <phase_6+0x20>
  401153:	48 8d 74 24 18       	lea    0x18(%rsp),%rsi
  401158:	4c 89 f0             	mov    %r14,%rax
  40115b:	b9 07 00 00 00       	mov    $0x7,%ecx
  401160:	89 ca                	mov    %ecx,%edx
  401162:	2b 10                	sub    (%rax),%edx
  401164:	89 10                	mov    %edx,(%rax)
  401166:	48 83 c0 04          	add    $0x4,%rax
  40116a:	48 39 f0             	cmp    %rsi,%rax
  40116d:	75 f1                	jne    401160 <phase_6+0x6c>
  40116f:	be 00 00 00 00       	mov    $0x0,%esi
  401174:	eb 21                	jmp    401197 <phase_6+0xa3>
  401176:	48 8b 52 08          	mov    0x8(%rdx),%rdx
  40117a:	83 c0 01             	add    $0x1,%eax
  40117d:	39 c8                	cmp    %ecx,%eax
  40117f:	75 f5                	jne    401176 <phase_6+0x82>
  401181:	eb 05                	jmp    401188 <phase_6+0x94>
  401183:	ba d0 32 60 00       	mov    $0x6032d0,%edx
  401188:	48 89 54 74 20       	mov    %rdx,0x20(%rsp,%rsi,2)
  40118d:	48 83 c6 04          	add    $0x4,%rsi
  401191:	48 83 fe 18          	cmp    $0x18,%rsi
  401195:	74 14                	je     4011ab <phase_6+0xb7>
  401197:	8b 0c 34             	mov    (%rsp,%rsi,1),%ecx
  40119a:	83 f9 01             	cmp    $0x1,%ecx
  40119d:	7e e4                	jle    401183 <phase_6+0x8f>
  40119f:	b8 01 00 00 00       	mov    $0x1,%eax
  4011a4:	ba d0 32 60 00       	mov    $0x6032d0,%edx
  4011a9:	eb cb                	jmp    401176 <phase_6+0x82>
  4011ab:	48 8b 5c 24 20       	mov    0x20(%rsp),%rbx
  4011b0:	48 8d 44 24 28       	lea    0x28(%rsp),%rax
  4011b5:	48 8d 74 24 50       	lea    0x50(%rsp),%rsi
  4011ba:	48 89 d9             	mov    %rbx,%rcx
  4011bd:	48 8b 10             	mov    (%rax),%rdx
  4011c0:	48 89 51 08          	mov    %rdx,0x8(%rcx)
  4011c4:	48 83 c0 08          	add    $0x8,%rax
  4011c8:	48 39 f0             	cmp    %rsi,%rax
  4011cb:	74 05                	je     4011d2 <phase_6+0xde>
  4011cd:	48 89 d1             	mov    %rdx,%rcx
  4011d0:	eb eb                	jmp    4011bd <phase_6+0xc9>
  4011d2:	48 c7 42 08 00 00 00 	movq   $0x0,0x8(%rdx)
  4011d9:	00 
  4011da:	bd 05 00 00 00       	mov    $0x5,%ebp
  4011df:	48 8b 43 08          	mov    0x8(%rbx),%rax
  4011e3:	8b 00                	mov    (%rax),%eax
  4011e5:	39 03                	cmp    %eax,(%rbx)
  4011e7:	7d 05                	jge    4011ee <phase_6+0xfa>
  4011e9:	e8 4c 02 00 00       	callq  40143a <explode_bomb>
  4011ee:	48 8b 5b 08          	mov    0x8(%rbx),%rbx
  4011f2:	83 ed 01             	sub    $0x1,%ebp
  4011f5:	75 e8                	jne    4011df <phase_6+0xeb>
  4011f7:	48 83 c4 50          	add    $0x50,%rsp
  4011fb:	5b                   	pop    %rbx
  4011fc:	5d                   	pop    %rbp
  4011fd:	41 5c                	pop    %r12
  4011ff:	41 5d                	pop    %r13
  401201:	41 5e                	pop    %r14
  401203:	c3                   	retq

首先读入六个数字，起始地址在寄存器rsp中。代码的第一部分是一个嵌套循环体：

40110e:	41 bc 00 00 00 00    	mov    $0x0,%r12d
401114:	4c 89 ed             	mov    %r13,%rbp
401117:	41 8b 45 00          	mov    0x0(%r13),%eax
40111b:	83 e8 01             	sub    $0x1,%eax
40111e:	83 f8 05             	cmp    $0x5,%eax
401121:	76 05                	jbe    401128 <phase_6+0x34>
401123:	e8 12 03 00 00       	callq  40143a <explode_bomb>
401128:	41 83 c4 01          	add    $0x1,%r12d
40112c:	41 83 fc 06          	cmp    $0x6,%r12d
401130:	74 21                	je     401153 <phase_6+0x5f>
401132:	44 89 e3             	mov    %r12d,%ebx
401135:	48 63 c3             	movslq %ebx,%rax
401138:	8b 04 84             	mov    (%rsp,%rax,4),%eax
40113b:	39 45 00             	cmp    %eax,0x0(%rbp)
40113e:	75 05                	jne    401145 <phase_6+0x51>
401140:	e8 f5 02 00 00       	callq  40143a <explode_bomb>
401145:	83 c3 01             	add    $0x1,%ebx
401148:	83 fb 05             	cmp    $0x5,%ebx
40114b:	7e e8                	jle    401135 <phase_6+0x41>
40114d:	49 83 c5 04          	add    $0x4,%r13
401151:	eb c1                	jmp    401114 <phase_6+0x20>

翻译成为伪代码是：

for (i = 0; i < 6; i++) {
	if (input[i] > 6 && input[i] <= 0)
		bomb!
			
	for (j = i + 1 ; j < 6; j++) {
		if (input[j] == input[i])
			bomb!
	}
}

第一个数字不能大于6且必须大于0，否则为0减一将是一个非常大的数，而且每个数字都不能一样。

后面又是一个循环体，反汇编代码如下

401158:	4c 89 f0             	mov    %r14,%rax
40115b:	b9 07 00 00 00       	mov    $0x7,%ecx
401160:	89 ca                	mov    %ecx,%edx
401162:	2b 10                	sub    (%rax),%edx
401164:	89 10                	mov    %edx,(%rax)
401166:	48 83 c0 04          	add    $0x4,%rax
40116a:	48 39 f0             	cmp    %rsi,%rax
40116d:	75 f1                	jne    401160 <phase_6+0x6c>

翻译成为伪代码如下：

while (rax != NULL) {
	*rax = 7 - *rax;
	rax += 4;
}

接下来这一部分是以刚才所得到的数字为序号，将一些地址存入起始地址为rsp+0x20的内存位置。这些地址的起始位置为0x6032d0，步长为8，序号为1则存入的地址为0x6032d0 + 0 8 = 0x6032d0，序号为5则存入的地址为0x6032d0 + 4 8 = 0x6032f0。

40116f:	be 00 00 00 00       	mov    $0x0,%esi
401174:	eb 21                	jmp    401197 <phase_6+0xa3>
401176:	48 8b 52 08          	mov    0x8(%rdx),%rdx
40117a:	83 c0 01             	add    $0x1,%eax
40117d:	39 c8                	cmp    %ecx,%eax
40117f:	75 f5                	jne    401176 <phase_6+0x82>
401181:	eb 05                	jmp    401188 <phase_6+0x94>
401183:	ba d0 32 60 00       	mov    $0x6032d0,%edx
401188:	48 89 54 74 20       	mov    %rdx,0x20(%rsp,%rsi,2)
40118d:	48 83 c6 04          	add    $0x4,%rsi
401191:	48 83 fe 18          	cmp    $0x18,%rsi
401195:	74 14                	je     4011ab <phase_6+0xb7>
401197:	8b 0c 34             	mov    (%rsp,%rsi,1),%ecx
40119a:	83 f9 01             	cmp    $0x1,%ecx
40119d:	7e e4                	jle    401183 <phase_6+0x8f>
40119f:	b8 01 00 00 00       	mov    $0x1,%eax
4011a4:	ba d0 32 60 00       	mov    $0x6032d0,%edx
4011a9:	eb cb                	jmp    401176 <phase_6+0x82>

再接下来一部分是组建线性表，将刚才存入的那些地址按照线性表的形式组织起来，前后相连。

4011ab:	48 8b 5c 24 20       	mov    0x20(%rsp),%rbx
4011b0:	48 8d 44 24 28       	lea    0x28(%rsp),%rax
4011b5:	48 8d 74 24 50       	lea    0x50(%rsp),%rsi
4011ba:	48 89 d9             	mov    %rbx,%rcx
4011bd:	48 8b 10             	mov    (%rax),%rdx
4011c0:	48 89 51 08          	mov    %rdx,0x8(%rcx) # 将第一项的后继指针指向第二项
4011c4:	48 83 c0 08          	add    $0x8,%rax
4011c8:	48 39 f0             	cmp    %rsi,%rax
4011cb:	74 05                	je     4011d2 <phase_6+0xde>
4011cd:	48 89 d1             	mov    %rdx,%rcx
4011d0:	eb eb                	jmp    4011bd <phase_6+0xc9>
4011d2:	48 c7 42 08 00 00 00 	movq   $0x0,0x8(%rdx) #

最后一项后面是空指针

1	4011d9: 00

最后一部分是比较线性表中数据的排序，需要按照降序排列。

4011da:	bd 05 00 00 00       	mov    $0x5,%ebp
4011df:	48 8b 43 08          	mov    0x8(%rbx),%rax # 取后一项的地址
4011e3:	8b 00                	mov    (%rax),%eax # 取后一项的值
4011e5:	39 03                	cmp    %eax,(%rbx) # 前一项与后一项进行比较
4011e7:	7d 05                	jge    4011ee <phase_6+0xfa> # 降序
4011e9:	e8 4c 02 00 00       	callq  40143a <explode_bomb>
4011ee:	48 8b 5b 08          	mov    0x8(%rbx),%rbx
4011f2:	83 ed 01             	sub    $0x1,%ebp
4011f5:	75 e8                	jne    4011df <phase_6+0xeb>

现在我们可以得出：需要根据我们输入的值，经过一次转换，作为线性表的序号，使得它们是按照降序排列的，那现在我们先看一下从0x6032d0开始，那些地址指向的值是什么。

(gdb) p/x *0x6032d0
$1 = 0x14c
(gdb) p/x *0x6032e0
$2 = 0xa8
(gdb) p/x *0x6032f0
$3 = 0x39c
(gdb) p/x *0x603300
$4 = 0x2b3
(gdb) p/x *0x603310
$5 = 0x1dd
(gdb) p/x *0x603320
$6 = 0x1bb
(gdb) p/x *0x603330
$7 = 0x0

它们的大小顺序为“0x39c > 0x2b3 > 0x1dd > 0x1bb > 0x14c > 0xa8”，对应的序号为“3 4 5 6 1 2”，因为每一项被7减过一次，得到的结果就是“4 3 2 1 6 5”，验证通过。

secret_phase

做到上面那一步，整个过程就可以结束了，程序正常结束。但是看程序的反汇编代码，可以看到有一个secret_phase函数，这是作为一个隐藏关卡的，那我们干脆一鼓作气，将整个隐藏关卡也拿下。

函数secret_phase的触发是有条件的，我们首先可以根据字符串搜索发现，它是在函数phase_defused中调用的，那我们先看该函数何时才会触发隐藏关卡。

00000000004015c4 <phase_defused>:
  4015c4:	48 83 ec 78          	sub    $0x78,%rsp
  4015c8:	64 48 8b 04 25 28 00 	mov    %fs:0x28,%rax
  4015cf:	00 00 
  4015d1:	48 89 44 24 68       	mov    %rax,0x68(%rsp)
  4015d6:	31 c0                	xor    %eax,%eax
  4015d8:	83 3d 81 21 20 00 06 	cmpl   $0x6,0x202181(%rip)        # 603760 <num_input_strings>
  4015df:	75 5e                	jne    40163f <phase_defused+0x7b>
  4015e1:	4c 8d 44 24 10       	lea    0x10(%rsp),%r8
  4015e6:	48 8d 4c 24 0c       	lea    0xc(%rsp),%rcx
  4015eb:	48 8d 54 24 08       	lea    0x8(%rsp),%rdx
  4015f0:	be 19 26 40 00       	mov    $0x402619,%esi
  4015f5:	bf 70 38 60 00       	mov    $0x603870,%edi
  4015fa:	e8 f1 f5 ff ff       	callq  400bf0 <[email protected]>
  4015ff:	83 f8 03             	cmp    $0x3,%eax
  401602:	75 31                	jne    401635 <phase_defused+0x71>
  401604:	be 22 26 40 00       	mov    $0x402622,%esi
  401609:	48 8d 7c 24 10       	lea    0x10(%rsp),%rdi
  40160e:	e8 25 fd ff ff       	callq  401338 <strings_not_equal>
  401613:	85 c0                	test   %eax,%eax
  401615:	75 1e                	jne    401635 <phase_defused+0x71>
  401617:	bf f8 24 40 00       	mov    $0x4024f8,%edi
  40161c:	e8 ef f4 ff ff       	callq  400b10 <[email protected]>
  401621:	bf 20 25 40 00       	mov    $0x402520,%edi
  401626:	e8 e5 f4 ff ff       	callq  400b10 <[email protected]>
  40162b:	b8 00 00 00 00       	mov    $0x0,%eax
  401630:	e8 0d fc ff ff       	callq  401242 <secret_phase>
  401635:	bf 58 25 40 00       	mov    $0x402558,%edi
  40163a:	e8 d1 f4 ff ff       	callq  400b10 <[email protected]>
  40163f:	48 8b 44 24 68       	mov    0x68(%rsp),%rax
  401644:	64 48 33 04 25 28 00 	xor    %fs:0x28,%rax
  40164b:	00 00 
  40164d:	74 05                	je     401654 <phase_defused+0x90>
  40164f:	e8 dc f4 ff ff       	callq  400b30 <[email protected]>
  401654:	48 83 c4 78          	add    $0x78,%rsp
  401658:	c3                   	retq

我们可以看到，直到前面六个关卡完全完成，判断条件cmpl $0x6,0x202181(%rip)才会通过，后面调用函数sscanf将地址为0x603870的字符串尝试解析成为两个整型和一个字符串（地址0x402619存储的格式化字符串为“%d %d %s”）。然后将第三个字符串与地址0x402622存储的字符串（“DrEvil”）比较，相等的话就可以触发隐藏关卡。通过使用gdb调试发现，地址0x603870存储的字符串就是我们通过第四关时候的输入的字符串，给之前我们的答案后面加上一个字符串“DrEvil”便能够触发隐藏关卡。

触发了隐藏关卡后，我们来看一下隐藏关卡secret_phase的反汇编代码：

0000000000401242 <secret_phase>:
  401242:	53                   	push   %rbx
  401243:	e8 56 02 00 00       	callq  40149e <read_line>
  401248:	ba 0a 00 00 00       	mov    $0xa,%edx
  40124d:	be 00 00 00 00       	mov    $0x0,%esi
  401252:	48 89 c7             	mov    %rax,%rdi
  401255:	e8 76 f9 ff ff       	callq  400bd0 <[email protected]>
  40125a:	48 89 c3             	mov    %rax,%rbx
  40125d:	8d 40 ff             	lea    -0x1(%rax),%eax
  401260:	3d e8 03 00 00       	cmp    $0x3e8,%eax
  401265:	76 05                	jbe    40126c <secret_phase+0x2a>
  401267:	e8 ce 01 00 00       	callq  40143a <explode_bomb>
  40126c:	89 de                	mov    %ebx,%esi
  40126e:	bf f0 30 60 00       	mov    $0x6030f0,%edi
  401273:	e8 8c ff ff ff       	callq  401204 <fun7>
  401278:	83 f8 02             	cmp    $0x2,%eax
  40127b:	74 05                	je     401282 <secret_phase+0x40>
  40127d:	e8 b8 01 00 00       	callq  40143a <explode_bomb>
  401282:	bf 38 24 40 00       	mov    $0x402438,%edi
  401287:	e8 84 f8 ff ff       	callq  400b10 <[email protected]>
  40128c:	e8 33 03 00 00       	callq  4015c4 <phase_defused>
  401291:	5b                   	pop    %rbx

首先读入一个字符串，调用函数strtol将输入字符串中的数字转换为10（0xa）进制长整型数字。这个数字减1之后必须小于1000（0x3e8），其实这两行汇编的意思是该数字需要大于0，小于等于1001。

然后将该数字作为参数传给函数func7，那还是先看一下其汇编代码：

0000000000401204 <fun7>:
  401204:	48 83 ec 08          	sub    $0x8,%rsp
  401208:	48 85 ff             	test   %rdi,%rdi
  40120b:	74 2b                	je     401238 <fun7+0x34>
  40120d:	8b 17                	mov    (%rdi),%edx
  40120f:	39 f2                	cmp    %esi,%edx
  401211:	7e 0d                	jle    401220 <fun7+0x1c>
  401213:	48 8b 7f 08          	mov    0x8(%rdi),%rdi
  401217:	e8 e8 ff ff ff       	callq  401204 <fun7>
  40121c:	01 c0                	add    %eax,%eax
  40121e:	eb 1d                	jmp    40123d <fun7+0x39>
  401220:	b8 00 00 00 00       	mov    $0x0,%eax
  401225:	39 f2                	cmp    %esi,%edx
  401227:	74 14                	je     40123d <fun7+0x39>
  401229:	48 8b 7f 10          	mov    0x10(%rdi),%rdi
  40122d:	e8 d2 ff ff ff       	callq  401204 <fun7>
  401232:	8d 44 00 01          	lea    0x1(%rax,%rax,1),%eax
  401236:	eb 05                	jmp    40123d <fun7+0x39>
  401238:	b8 ff ff ff ff       	mov    $0xffffffff,%eax
  40123d:	48 83 c4 08          	add    $0x8,%rsp
  401241:	c3                   	retq

这个函数又是一个递归函数，尝试写出其伪代码如下：

func7 (rdi, rsi) 
{
	if (rdi == NULL)
		return -1;
	edx = *rdi;
	if (edx <= esi) {
		eax = 0;
		if (edx == esi)
			return eax;
		else
			return 2 * func7(rdi + 0x10, rsi) + 1;
	} else {
		return 2 * func7(rdi + 0x8, rsi);
	}
}

与分析函数func4的方法类似，但是此处需要返回值为2，那么最后返回值肯定是2*a，这里啊要等于1，那么再往深走一层要等于返回2*a + 1，这里的a需要为0，那么再深一层要返回0；这样最理想的情况是只需要递归三层即可。以下是起始地址开始指向的一些数值：

(gdb) p/d *0x6030f0
$2 = 36
(gdb) p/x *0x6030f8
$12 = 0x603110
(gdb) p/x *0x6030f8
$13 = 0x603110
(gdb) p/x *0x603110
$14 = 0x8
(gdb) p/x *0x603100
$15 = 0x603130
(gdb) p/x *0x603130
$16 = 0x32
(gdb) p/d *0x603130
$17 = 50
(gdb) p/x *0x603108
$18 = 0x0
(gdb) p/x *0x603110
$19 = 0x8
(gdb) p/x *0x603118
$20 = 0x603190
(gdb) p/x *0x603190
$21 = 0x6
(gdb) p/x *0x603120
$22 = 0x603150
(gdb) p/x *0x603150
$23 = 0x16

最开始的rdi是36，走下面那一层需要比36小，然后rdi变为*0x6030f8，即0x603110，它指向的值为8，要想走上面那一层需要比8大，rdi改为*0x603120，即0x603150，它指向的值为0x16，即22，再往深一层需要它返回0，那么我们直接输入数字22即可，而且恰好满足这些条件，那么答案就是22。

不走心的总结

至此，所有的关卡全部通过。

通过这个实验，一是巩固了对于汇编代码的阅读能力（尤其是对一些常见的控制结构进行辨别），二是掌握了许多gdb调试的基本指令和技巧。

bomblab-writeup

前言

Phase_1

Phase_2

Phase_3

Phase_4

Phase_5

Phase_6

secret_phase

不走心的总结

参考资料

近期文章

近期评论

标签

热门

文章归档

分类目录

功能