利用abort提权

@Peterpan0927 wrote:

0x00.前言

感觉名字不好听，但是我也不知道取什么名字了…

在玄武实验室的日推中发现了这个漏洞，发现又是个没见过的bypass姿势，于是就来研究一下吧，这个是利用了launchd的一个漏洞，通过向他发送恶意消息可以将对应的进程dealloc掉，然后伪造这个进程，相当于做port间的中间人的攻击，就可以拿到其他进程的send right，在这一点的基础上进行沙盒逃逸，提权和绕过签名。

通过Brandon的写的文章我们来对整个的利用过程进行一个剖析，其实也可以视为是对他的文章的翻译，稍微修改了下，因为原文已经说的算是比较清楚了。

0x01.漏洞产生处

Brandon在进行iOS上的crash报告研究的时候，发现了这个漏洞，可以一种特殊的crash方式，可以让内核向launchd发送一个Mach message，从而使launchd将这个进程的send right在他的ipc_space中over-dealloced掉(double free)。那么我们就可以冒充这个进程。

这个漏洞在macOS上也出现了，只不过在iOS上触发条件更为严格，因为在iOS上要求这个Mach message 从内核发送。

launchd在处理EXC_CRASH异常消息时的over-deallocation

当一个进程发送mach_exception_raise 或者 mach_exception_raise_state_identity消息给他的bootstap port的时候，launchd将会把这个异常消息作为一个host level的异常去接收。

不幸的是，launchd去处理这些代码的方式是有问题的，当异常的类型是EXC_CRASH的时候，launchd会销毁掉消息中的thread和task port并返回KERN_FAILURE，接下来MIG系统会把这些再次销毁(这样的原因是因为如果返回的是KERN_SUCCESS，就意味着launchd持有着这个消息中的资源，如果是KERN_FAILURE，就意味着它并没有这些资源的所有权)

下面就是处理部分的代码:
kern_return_t __fastcall
catch_mach_exception_raise(                             // (a) The service routine is
        mach_port_t            exception_port,          //     called with values directly
        mach_port_t            thread,                  //     from the Mach message
        mach_port_t            task,                    //     sent by the client. The
        exception_type_t       exception,               //     thread and task ports could
        mach_exception_data_t  code,                    //     be arbitrary send rights.
        mach_msg_type_number_t codeCnt)
{
    __int64 __stack_guard;                 // ST28_8@1
    kern_return_t kr;                      // w0@1 MAPDST
    kern_return_t result;                  // w0@4
    __int64 codes_left;                    // x25@6
    mach_exception_data_type_t code_value; // t1@7
    int pid;                               // [xsp+34h] [xbp-44Ch]@1
    char codes_str[1024];                  // [xsp+38h] [xbp-448h]@7

    __stack_guard = *__stack_chk_guard_ptr;
    pid = -1;
    kr = pid_for_task(task, &pid);
    if ( kr )
    {
        _os_assumes_log(kr);
        _os_avoid_tail_call();
    }
    if ( current_audit_token.val[5] )                   // (b) 如果发送这个消息的进程pid不是0
    {                                                   //     (不是内核进程)
        result = KERN_FAILURE;                          //     那么就会被拒绝
    }                                                        
    else
    {
        if ( codeCnt )
        {
            codes_left = codeCnt;
            do
            {
                code_value = *code;
                ++code;
                __snprintf_chk(codes_str, 0x400uLL, 0, 0x400uLL, "0x%llx", code_value);
                --codes_left;
            }
            while ( codes_left );
        }
        launchd_log_2(
            0LL,
            3LL,
            "Host-level exception raised: pid = %d, thread = 0x%x, "
                "exception type = 0x%x, codes = { %s }",
            pid,
            thread,
            exception,
            codes_str);
        kr = deallocate_port(thread);                   // (c) 消息中的"thread" port
        if ( kr )                                       //     被deallocate掉了
        {
            _os_assumes_log(kr);
            _os_avoid_tail_call();
        }
        kr = deallocate_port(task);                     // (d) 消息中的"task" port
        if ( kr )                                       //     被deallocat掉了
        {
            _os_assumes_log(kr);
            _os_avoid_tail_call();
        }
        if ( exception == EXC_CRASH )                   // (e) 如果异常的类型是
            result = KERN_FAILURE;                      //     EXC_CRASH, 就会返回
        else                                            //     KERN_FAILURE，MIG
            result = 0;                                 //     就会再次deallocate这些port
    }
    *__stack_chk_guard_ptr;
    return result;
}
要想真正利用这个漏洞，就要能控制我们想要释放的服务，然后伪装成这个服务，那么我们就有很多的机会去提权呢，那么如何做到精准的释放呢？

触发漏洞

我们之所以能够触发漏洞来精准的释放我们想要释放的服务来源于task_set_special_port，在内核生成一个task的异常消息的时候，内核会使用task_set_special_port的send right，而不是task本身的，所以同理，通过thread_set_special_port这个API就能达到我们的目的了。

总的来说，我们分为下面几步：

通过thread_set_exception_ports来将launchd作为异常处理者

通过bootstrap_look_up来找到我们想要伪装的服务

通过 task_set_special_port/thread_set_special_port设置将要替代的服务，用于替代异常消息中的send right

调用abort，内核就会生成EXC_CRASH类型的异常消息发送给launchd

launchd解析异常消息释放掉目标服务

在crash之后继续运行

因为调用abort之后我们的进程就会被杀掉了，我们想要继续运行接下来的代码就需要新的方法

如果是其他的异常类型进程是可以恢复的，只需要将其thread exception handler设置为launchd，而task级别的设置为他自己。那么在launchd无法处理这个异常的时候，就会交给它自身了，从而线程状态并告知内核异常消息已经被处理。但是一个进程不能捕捉到它自身的EXC_CRASH消息，所以我们需要两个进程。

一个策略就是首先在另一个进程中触发漏洞，强制设置kernel port并crash掉，然而，用App extension是一个更好的方式。

App extension在iOS 8中引入，它提供了将应用的一些功能打包，运行在应用之外的能力，它的代码运行在一个隔离的沙盒进程中，本来是和App extension通信的API，但是Ian McDowell写了一个文章描述如何通过私有APINSExtension去启动应用扩展并和它通信，我们也就是通过向launchd注册应用扩展服务的那个端口和应用扩展进程之间通信。

避免launchd中的端口复用

这里就是说了一个老生常谈的技巧，为了防止端口被其他的服务给抢占了，我们可以注册大量的服务，持有这些端口的recv right，那么等我们abort的时候，这些端口也被释放掉了，构造出一长串的freelist，而且我们最先释放的就是我们的目标服务，所以之后注册的服务就不大可能会复用到它头上来了。

这个方法的局限性就在于我们需要com.apple.security.application-groups的entitlement去向launchd注册服务，虽然还有其他方式，但这种毫无疑问是最简单的了。

伪装成被释放的服务

在我们的应用扩展释放了launchd中的目标服务的send right，我们需要占有那个port name，从而可以做port之间的中间人攻击，截获所有客户端和service通信的消息。

这里因为已经使用了应用组的entitlement，所以我们就注册大量的服务直到他们其中的一个重用到了之前的那个port name，那么其他的客户端寻找目标服务的时候launchd就会将客户端的send right返回给我们的端口，而不是原先的服务。

0x02.攻击步骤

源代码都在sandbox_escape.c中，感兴趣的可以去参考链接中下载继续分析一下。

步骤1.获取host-priv端口

我们的目标就是伪造SafetyNet，然后使ReportCrash崩溃掉，然后从异常消息中取回ReportCrash的task port，然后通过task_get_special_port拿到host-priv port，这就是我们整个流程的思路。

ReportCrash和SafetyNet

ReportCrash是在iOS系统上生成崩溃报告的，它事实上有4个服务，每一个都在不同的进程中：

com.apple.ReportCrash，它是EXC_CRASH、EXC_GUARD和EXC_RESOURCE在 host level的处理者

com.apple.ReportCrash.Jetsam 处理Jetsam的报告

com.apple.ReportCrash.SimulateCrash 创建模拟器的崩溃报告

com.apple.ReportCrash.SafetyNet 是 com.apple.ReportCrash 的异常处理服务

当ReportCrash启动的时候，它会在launchd中去寻找SafetyNet服务，并将返回的端口作为task level的异常处理，也就是说，当ReportCrash崩溃的时候，由SafetyNet去处理它的消息，不仅如此，这两个服务在沙盒中都是可以访问到的。

操作ReportCrash的前提

要想引出接下来的攻击，我们必须要达成接下来的步骤：后台ReportCrash，然后强迫它退出，奔溃掉，并保证我们使用它的时候它是一直运行的，至于为什么这样做，怎么做到接下来就是解释部分了：

启动部分很简单，只需要通过一条Mach message，launchd收到请求就会在启动他了，然而由于它奇怪的设定，除了mach_exception_raise_state_identity之外的任何消息都是使它停止接收新消息并退出，如果我们之后要让它一直存活就要注意这一点。

退出很简单就不说了，崩溃有很多方式，最简单的就是发送一个thread port设置为MACH_PORT_NULL的mach_exception_raise_state_identity消息即可。

要保持让它一直运行，而且我们只能发送mach_exception_raise_state_identity消息，所以我们只能从这个消息上去想办法，ReportCrash只有当所有生成崩溃报告的线程完成之后才会退出，所以我们只要想办法阻塞其中一个线程即可

从函数的调用可以发现当ReportCrash想要创建一个崩溃报告的时候，会通过task_policy_get方法从异常消息中获取task port，这会向那个端口发送一个消息并等待回复，而我们的这个task port可以自己设置，从而让它一直等待回复，而ReportCrash则一直等待task_policy_get这个函数去返回。

下面解释为什么要这么做：

我们要伪造的服务是SafetyNet，通过漏洞将它释放掉然后我们自己占有原来的那个port name

让所有的ReportCrash实例退出掉，来确保接下来的ReportCrash会去查找我们伪造的服务，并将其作为EXC_CRASH的接收目标

崩溃ReportCrash，我们伪造的服务将接收到崩溃消息

从消息中可以提取到ReportCrash的task port

通过task_get_special_port拿到host port，因为这个是以root身份运行的，所以就是一个host priv端口

步骤2.沙盒逃逸

虽然拿到了host priv端口，但是我们还没有在沙盒之中，所以我们还需要进行沙盒逃逸，严格的来说这两步并不存在先后顺序，只是沙盒逃逸会让系统变得不稳定，所以我们就先拿到host priv端口再说。

这一步中我们还是利用launchd的漏洞去拿到task port，伪造的服务是CARenderServer，然后和com.apple.DragUI.druid.source通信，druid是一个无沙盒的守护进程，会将它的task port通过Mach message传给我们伪造的服务。

但是这个方式在iOS11.3之后就不能用了，但是可以去寻找其他符合的服务，但前提是我们能够伪造成系统的服务，不然就是一切就休，不用谈下一步了

崩溃druid

就像之前对ReportCrash所做的事情一样，这里用到了一个libxpc的bug去达成，作者发现了一个可以让任何XPC服务崩溃掉的越界读：
void _xpc_dictionary_apply_wire_f
(
        OS_xpc_dictionary *xdict,
        OS_xpc_serializer *xserializer,
        const void *context,
        bool (*applier_fn)(const char *, OS_xpc_serializer *, const void *)
)
{
...
    uint64_t count = (unsigned int)*serialized_dict_count;
    if ( count )
    {
        uint64_t depth = xserializer->depth;
        uint64_t index = 0;
        do
        {
            const char *key = _xpc_serializer_read(xserializer, 0, 0, 0);
            size_t keylen = strlen(key);
            _xpc_serializer_advance(xserializer, keylen + 1);
            if ( !applier_fn(key, xserializer, context) )
                break;
            xserializer->depth = depth;
            ++index;
        }
        while ( index < count );
    }
...
}
很显然的看出来上面的strlen函数没有对用户的数据做检查，所以在反序列化的时候访问越界内存或者_xpc_serializer_advance尝试找到data的末尾都会导致crash。

所以我们只需要构造一个键值没有闭合的字典作为XPC消息就可以让druidcrash了。

获取druid的task port

通过launchd的漏洞伪造CARenderServer

通过Mach message启动druid

如果没有收到task port就用libxpc的bug杀掉再重启

拿到druid的task port

绕过平台二进制task port的限制

虽然我们拿到了druid的task port，但是并不能做到在这个进程内的代码执行，原因就是因为task_conversion_eval，在源码中可以看到调用关系：
task_t
convert_port_to_task(
	ipc_port_t		port)
{
	return convert_port_to_task_with_exec_token(port, NULL);
}

task_t
convert_port_to_task_with_exec_token(
	ipc_port_t		port,
	uint32_t		*exec_token)
{
	task_t		task = TASK_NULL;
	if (IP_VALID(port)) {
		ip_lock(port);
		if (	ip_active(port)	&&	ip_kotype(port) == IKOT_TASK	) {
			task_t ct = current_task();
			task = (task_t)port->ip_kobject;
			assert(task != TASK_NULL);

			if (task_conversion_eval(ct, task)) {
				ip_unlock(port);
				return TASK_NULL;
			}
	...
	return (task);
}
其中task_conversion_eval就进行了校验，每个task只能使用他们自己的task ports，只有kernel task才有所有的权限：
kern_return_t
task_conversion_eval(task_t caller, task_t victim)
{
	/*
	 * Tasks are allowed to resolve their own task ports, and the kernel is
	 * allowed to resolve anyone's task port.
	 */
	if (caller == kernel_task) {
		return KERN_SUCCESS;
	}

	if (caller == victim) {
		return KERN_SUCCESS;
	}

	/*
	 * Only the kernel can can resolve the kernel's task port. We've established
	 * by this point that the caller is not kernel_task.
	 */
	if (victim == kernel_task) {
		return KERN_INVALID_SECURITY;
	}

#if CONFIG_EMBEDDED
	/*
	 * On embedded platforms, only a platform binary can resolve the task port
	 * of another platform binary.
	 */
	if ((victim->t_flags & TF_PLATFORM) && !(caller->t_flags & TF_PLATFORM)) {
#if SECURE_KERNEL
		return KERN_INVALID_SECURITY;
#else
		if (cs_relax_platform_task_ports) {
			return KERN_SUCCESS;
		} else {
			return KERN_INVALID_SECURITY;
		}
#endif /* SECURE_KERNEL */
	}
#endif /* CONFIG_EMBEDDED */

	return KERN_SUCCESS;
}
这就意味着哪怕我们拿到了druid的task port，也没有办法通过mach_vm_*去修改它的任何东西
/*
 *	Returns the set of threads belonging to the target task.
 */
routine task_threads(
		target_task	: task_inspect_t;
	out	act_list	: thread_act_array_t);
但是Bradon在看一个MIG文件的时候发现有一个函数task_threads，枚举task内的线程，重点是这里的参数是task_inspect_t而非task_t，这就意味着MIG转换的时候用的并不是convert_port_to_task而是convert_port_to_task_inspect，从这个函数的逆向代码中可以看到其中并没有进行task_conversion_eval，这意味着函数可以执行成功，更有意思的一点是返回的并不是thread_inspect_t rights，而是thread_act_t。也就是说，通过task_threads这个函数，我们将不可修改的task right替换成了可以修改的thread right，在线程层次上也不存在说类似task层面上的校验，也就是说我们可以通过Mach thread API去绕过task_conversion_eval。

Brandon还在已有的Mach thread API上封装了一个能力更强的库threadexec，在Poc中用的就是这个库。

步骤3.创建一个新的host层级的异常处理

通过host_get_exception_ports拿到host level对于EXC_BAD_ACCESS的异常处理端口

分配一个端口作为新的异常处理

将host-priv port和send right给我们刚创建的端口

利用我们在druid中的上下文调用host_set_exception_ports设置我们新的异常处理端口

完成之后，任意访问非法内存并且没有注册的异常处理的进程，我们就可以通过EXC_BAD_ACCESS异常消息拿到那些进程的task port，由于这个异常是可恢复的，那么就意味着可以通过task port去执行代码了。

步骤4.拿到ReportCrash的task port

我们之所以要再次获取这个，是因为之前的ReportCrash进程已经crash了
让ReportCrash触发EXC_BAD_ACCESS
mach_port_t reportcrash = context->reportcrash_service;
	reportcrash_keepalive_assertion_t reportcrash_assertion
		= reportcrash_keepalive(reportcrash);
	if (reportcrash_assertion == 0) {
		ERROR("Could not generate keepalive assertion for %s", REPORTCRASH_NAME);
		return false;
	}
	...
	// 触发EXC_BAD_ACCESS的异常
	reportcrash_keepalive_assertion_release(reportcrash_assertion);
因为ReportCrash并没有这种消息的处理者，EXC_CRASH消息的处理者是SafetyNet，所以异常消息会发送到我们分配的那个端口上去
接收到异常消息之后，将task port和thread port保存下来，并让进程恢复

利用端口在进程内做代码执行，就像druid中一样
步骤5.恢复原来的host-level异常处理

接下来的两步并不是一定要做但是最好还是做一下，这样exploit执行完成之后我们并不需要去重启设备或者做别的操作，和之前的系统基本一致。

当我们拿到ReportCrash内的代码执行之后，我们应该将原来的host level exception handler恢复回去，通过druid调用host_set_exception_ports去重置异常处理端口:
bool ok = threadexec_host_set_exception_ports(
			context->druid_tx,
			context->host_priv,
			EXC_MASK_BAD_ACCESS,
			context->host_exception_handler,
			context->host_exception_behavior,
			context->host_exception_flavor);
步骤6.修复launchd

通过task_for_pid拿到launchd的task port

对于我们伪造的每个服务，都进行以下操作：

拿到fake service的port name

将fake port和服务都销毁掉

调用mach_port_insert_right把真实的服务再塞回去

0x03.提权过程

都到这里了你还想要什么？

0x04.参考链接

bazed‘s poc

Posts: 2

Participants: 2

Read full topic

0x00.前言

0x01.漏洞产生处

launchd在处理EXC_CRASH异常消息时的over-deallocation

触发漏洞

在crash之后继续运行

避免launchd中的端口复用

伪装成被释放的服务

0x02.攻击步骤

步骤1.获取host-priv端口

ReportCrash和SafetyNet

操作ReportCrash的前提

步骤2.沙盒逃逸

崩溃druid

获取druid的task port

绕过平台二进制task port的限制

步骤3.创建一个新的host层级的异常处理

步骤4.拿到ReportCrash的task port

步骤5.恢复原来的host-level异常处理

步骤6.修复launchd

0x03.提权过程

0x04.参考链接

Trending Articles

步骤1.获取`host-priv`端口

绕过平台二进制`task port`的限制