iOS应用安全之代码混淆

最新推荐文章于 2022-11-25 18:24:29 发布

iOS_开发

最新推荐文章于 2022-11-25 18:24:29 发布

阅读量557

点赞数

原文链接：https://j.youzan.com/-2-ESY

版权

Python实战社群

Java实战社群

长按识别下方二维码，按需求添加

640.webp (1).jpg

扫码关注添加客服

进Python社群▲

微信图片_20200223084351_副本.png

扫码关注添加客服

进Java社群▲

作者 | kingly
来源 | Github

https://github.com/kingly09/KYSecurityDefense/blob/master/README_hx.md

01 理论

iOS应用安全随着各种事件的曝出，越来越受到重视。那针对iOS应用安全方面能做点什么呢？如何让我们开发的应用更安全一点呢？要知道如何才能安全，就要了解iOS应用怎么就不安全了呢？现在随着越狱技术的提高和各种工具的完善，使得逆向分析一款iOS应用变成了一个轻而易举的事情。因此，要使的iOS应用更安全，那就从逆向工程的各个阶段进行层层阻拦。当然，这个只是增加逆向到难度而已～。

iOS应用逆向分析分为静态分析和动态分析。分析的前提是先有一部越狱过的设备，然后再应用去壳，将去壳后的应用利用工具 class-dump导出头文件(先透漏下，本文就是针对它的，哈哈～)，用于分析程序逻辑及设计实现,利用IDA 或Hoper进行反汇编。以上两种方法为静态分析。利用LLDB对应用进行动态调试验证，那这个方法就是动态分析了。逆向的事也不多说了（就知道这些-_-|），本文的设计就是为了增加导出头文件分析的难度，让逆向人员看着头文件两眼冒金星～～

为了达到看一眼两眼冒金星的效果，现打算将以下内容进行混淆：

1.文件名

2.类名

3.协议名

4.属性名

5.函数名

元芳，你怎么看？将以上内容混淆后，然后编译发布。这样使用 class-dump导出的头文件，应该也是混淆后的了。这样也就达到了我们的目的。

采用何种方式混淆呢？混淆无非就是将原来字解释的关键字变的不可读，那就简单点，直接调用系统自带的md5加密算法加密就可以了。

那混淆就简单的很了，混淆看来是指日可待了～

混淆原理：将以上需要混淆的内容关键字提取去来，然后md5加密，然后再替换工程中出现的关键字。

原理很简单，要考虑哪些问题呢？

1.如何提取关键字？

2.混淆算法就简单了，这个不是问题...

3.混淆后的关键字，怎么替换原来的关键字呢？

4.混淆后的工程还要还原回去吗？

5.混淆程序采用何种方式实现？

...

1.如何提取关键字？

提取关键字，当然是根据各种关键字自己的特性使用工具自动完成提取的。人工提取那还不疯了！！！如果工具提取，那符合规则的关键字包括系统的，不就都提取出来了？这样程序还能编译通过吗？也就是说提取关键字，只能提取自定义的，不能把系统自己生成的或使用的也提取出来。这个有点麻烦～～～～～。

2.混淆算法

md5，这个是不可逆的，所以混淆后，要保留关键字和加密后的对应表，方便后续排除bug用。

3.混淆后的关键字，怎么替换原来的关键字呢？

这个当然是使用工具批量替换了，如果遇到以下情况怎么办？

原字符串：“This is my fish.” 要将is” 替换为”is not“。我们希望的当然是：“This is not my fish.” 而不是“This not is not my fis noth.” 。也就是说，要达到想要的目的，必须是单词匹配替换，这个很重要。

4.混淆后的工程还要还原回去吗？

能混淆，当然能还原回去，但是好像没有必要哦～～，那就不考虑还原回去了，我的地盘听我的，呵呵。

5.混淆程序采用何种方式实现？

首先当然是脚本了，命令行工具丰富的很，拿来用即可。只是可惜，还要一个个学习而已。

还整点啥景呢？没了就开始整呗～

02 实现

针对设计篇描述的大致思路，现在针对各个问题点，给出实现方法

该脚本大致使用的工具如下：vi、grep、sed、find、awk、cut、sort、uniq、cat、md5等。

针对要加密的内容，分别给出关键字提取脚本命令。

脚本中 $ROOTFOLDER 代表工程根目录，$EXCLUDE_DIR 代表要排除的目录，举例如下：

    ROOTFOLDER="demoProject"
    EXCLUDE_DIR="--exclude-dir=*.framework --exclude-dir=include --exclude-dir=libraries --exclude-dir=Libs --exclude-dir=lib"

关键字提取

1.文件名

第一步先将包含路径的文件名写入文件

find $ROOTFOLDER -type f | sed "/\/\./d" >f.list

第二步文件中提取文件名

cat f_rep.list | awk -F/ '{print $NF;}'| awk -F. '{print $1;}' | sed "/^$/d" | sort | uniq

但从文件名提取的功能上，上面两个步骤完全可以合并为一步，但是在实际功能实现中还是要求将上面分为两步的

2.类名

grep -h -r -I  "^@interface" $ROOTFOLDER  $EXCLUDE_DIR  --include '*.[mh]' | sed "s/[:(]/ /" |awk '{split($0,s," ");print s[2];}'|sort|uniq

其中sort，排序；uniq 去除重复的。

3.协议名

grep -h -r -I  "^@protocol" $ROOTFOLDER  $EXCLUDE_DIR  --include '*.[mh]'| sed "s/[\<,;].*$//g"|awk '{print $2;}' | sort | uniq

4.属性名

grep -r -h -I  ^@property $ROOTFOLDER  $EXCLUDE_DIR --include '*.[mh]' | sed "s/(.*)/ /g"  | sed "s/<.*>//g" |sed "s/[,*;]/ /g" | sed "s/IBOutlet/ /g" |awk '{split($0,s," ");print s[3];}'|sed "/^$/d" | sort |uniq

其中

sed "/^$/d"

是去除空行。

5.函数名

grep -h -r -I  "^[-+]" $ROOTFOLDER $EXCLUDE_DIR --include '*.[mh]' |sed "s/[+-]//g"|sed "s/[();,: *\^\/\{]/ /g"|sed "s/[ ]*</</"|awk '{split($0,b," ");print b[2];}'| sort|uniq |sed "/^$/d"|sed "/^init/d"

函数名提取，目前只是提取函数名第一段的名称，如：

－(void)funName:(NSString *)param1 secondParam:(NSString *)param2;

那么该脚本只会提取出funName。脚本中

是将函数中的以 init开头的函数去除，因为，oc中初始化函数默认是以init`开头的，如果把该类的函数也混淆的话，会有问题的。

那么，以上脚本即可实现各种关键词的收集，收集后合并成一个文件，然后再排序去重复。

小小结

上述脚本提取出来的关键字包括系统自带的，也包括我们自己自定添加的，如果全部拿出混淆，那么我们混淆后的程序肯定是无法运行的，甚至无法通过编译。那么我们该怎么办？这个问题就是设计篇中提出的比较麻烦多事。最容易想到点方法就是，判断该关键字是否是系统自用的，如果是就不去混淆，相反就去混淆。那怎么系统用了哪些关键字？简单的很了，就是用上述提到的脚本，将系统使用的关键字，提取出来，作为系统自用的保留字。这样用排除法就可以解决这个麻烦的问题了，虽然比较笨拙，但是管用。

那么第一步就需要制作一个系统保留字字典库。用上述脚本即可完成。

那么第二步就是提取要替换的关键字，同样是用上述脚本，仔细看，你会发现个问题。提取文件名的时候，是将所有文件名都提取出来了，包括排除的目录，因此，在这个地方会有问题。我们要在文件名提取时，排除已经排除的目录或者将排除的目录文件名作为临时保留字。

过滤并加密保留字

将以上两步获取的关键字进行过滤。

    cat $SOURCECODEKEYWORDS |
    while read line
    do
    if grep $line $RESKEYSALL  
    then  
    echo filter1: $line  
    else  
    md5 -r -s $line  | sed s/\"//g >> $REPLACEKEYWORDS
    fi
    done

其中$SOURCECODEKEYWORDS是从ROOTFOLDER中提取的要混淆的关键字

替换工程中关键字

该步骤是本功能的核心，要实现文件中的关键字替换，不对，准确的说，应该是文件中的关键字单词替换。这个就是设计篇中提到的问题。

愿字符串："This is my fish.” 要将is” 替换为”is not“。我们希望的当然是：“This is not my fish.” 而不是“This not is not my fis noth.” 。也就是说，要达到想要的目的，必须是单词匹配替换，这个很重要。经过实践证明，OS X版的sed并没有实现单词匹配替换，只能是将匹配正则表达式的行，进行字符串替换，也就是替换后是我们不想要的结果。这个可肿么办？还好经过一番挖掘，找到一种比较笨拙的办法，效果如下，又要发挥愚公精神了。

    sed -i '' '
    '"$v2"'s/)'"$var2"':/)'"$var1"':/g
    '"$v2"'s/('"$var2"':/('"$var1"':/g
    '"$v2"'s/ '"$var2"':/ '"$var1"':/g
    '"$v2"'s/\"'"$var2"':/\"'"$var1"':/g
    ' $v1

其中，v2代表行号；var2代表要替换的关键字，即例子中的“is”；var1是混淆后的字符串；v1 是指文件路径，包括文件名；－i表示直接修改文件，后面必须带两个单引号,要不然会有错误，单引号内容应该是要备份的文件名，在此不需要备份所以为空；在第一行和最后一行之间的意思是，描述单词出现时的各种场景，要想达到单词匹配的效果，那就在此必须列举所有情景，这个真够蛋疼的～～，愚公上吧！！！

替换属性设置方法

    cat repProperty.txt |
    while read line
    do  
    ar=(`echo "$line"|cut -f 1-2 -d " "`)
    first=`echo ${ar[1]}|cut -c -1| sed "y/abcdefghijklmnopqrstuvwxyz/ABCDEFGHIJKLMNOPQRSTUVWXYZ/"`
    second=`echo ${ar[1]}|cut -c 2-`
    lastFind=`echo set$first$second`
    lastRep=`echo setZ${ar[0]}m`
    rm -f rep.tmp
    if grep -r -n -I -w "$lastFind"  $ROOTFOLDER $EXCLUDE_DIR   --include="*.[mhc]" --include="*.mm" --include="*.storyboard" --include="*.xib" >rep.tmp
    then  
    cat rep.tmp |
    while read l
    do  
    v1=$(echo "$l"|cut -d: -f 1 )
    v2=$(echo "$l"|cut -d: -f 2 )
    sed -i '' ''"$v2"'s/'"$lastFind"'/'"$lastRep"'/g' $v1  
    echo "step3:"$l  
    done  
    else  
    echo "step3:do not find:"$lastFind  
    fi  
    done

这个也是相对比较麻烦的，因为oc的属性系统是可以自动合成setter函数的，所以属性的混淆需要额外多考虑点。上面的做法是，根据提取的过滤后的属性关键字，生成属性设置函数，然后查找过程中是否有用到，有就混淆掉。

文件名混淆

    cat f_rep.list |
    while read line
    do
    echo "old name:"$line  
    v1=$(echo "$line" | sed "s/\// /g" | awk '{print $NF}')
    echo "v1="$v1  
    v2=$(echo $v1 | sed "s/\./ /g" | awk '{print $1}')
    echo "v2="$v2  
    if grep -w $v2 $RESKEYSALL  
    then  
    echo "find."  
    else  
    v3=$(echo $v1 | sed "s/\./ /g" | awk '{print "."$2}')
    echo "v3="$v3  
    v4=$(md5 -q -s "$v2" | sed "s/.*/z&m/g")
    echo "v4="$v4  
    v5=$(echo "$line" | sed "s/"$v1"//g")
    echo "v5="$v5  
    mv $line $v5$v4$v3  
    echo "new name:"$v5$v4$v3  
    fi
    done

文件名混淆的原理就是将需要混淆的文件路径，提取出要混淆的部分，然后组合成最终的文件名，使用mv命令完成文件名混淆。

至此，设计篇中提及的要混淆的内容已经全部完成混淆。

注意事项

1.需要将工程名称作为临时保留关键字

如：工程名称demoProject，那么demoProject要作为保留字，否则混淆后，可能target的名称也会被混淆掉，这个不是我们期望的；

2.需要将工程中的子目录名称作为临时保留关键字

如：在工程目录下有子文件夹AFNetworking，在Xcode工程的导航里也可以看到AFNetworking的分组，此时，如果AFNetworking也被混淆，那么工程中的分组会变成混淆后的字符串，但是工程目录下的子文件夹AFNetworking并没有改变，所以此时，会找不到响应的文件；根本原因是我们的混淆没有对文件夹名进行混淆。

3.需要将访问网络时组织的参数名称作为临时保留关键字

如：有一个属性名为：passport；恰好在组织网络参数时，有一个字段也叫passport，如果作为属性关键字passport被混淆了，那么组织网络参数时用的passport也会被混淆掉，所以此时传给后台的关键字passport就变了，导致后台无法识别；因此，出现这个情况时，要添加到临时的保留字中；如果编码规范的话，不用添加临时保留字也会避免～

4......

03 使用

全部 KYConfuse.sh ，实现代码如下：

#!/bin/bash
echo "#########################################"
echo  "File Name:KYConfuse.sh  "
echo  "Copyright (c) 2018 KYConfuse"
echo  "Email:362108564@qq.com"
echo  "Create:2018.05.28"
echo "#######################################"
echo "用户修改区－开始"
#要替换的源代码所在的根目录,该脚本文件与根目录处于同级文件夹
ROOTFOLDER="KYSecurityDefenseDemo"
#要排除的文件夹,例如demo中用到的第三方库AFNetworking，pods的第三方库等
EXCLUDE_DIR=" --exclude-dir=Pods --exclude-dir=buildAppstore --exclude-dir=Carthage --exclude-dir=Images.xcassets  --exclude-dir=Assets.xcassets  --exclude-dir=Certificates --exclude-dir=fastlane --exclude-dir=fastlanelog"
echo "用户修改区－结束"

#自定义的保留关键字,相当与白名单，添加到该文件中，一行一个，加入该文件的关键字将不被混淆;如工程中自定义的文件夹名称
RESCUSTOM="resCustom.txt"

#保留关键字文件不可删除
RESERVEDKEYWORDS="./reskeys.txt"
#最终的保留关键字＝保留关键字＋文件名
RESKEYSALL="./reskeysall.txt"
#提取的所有关键字
SOURCECODEKEYWORDS="./srckeys.txt"
#过滤后，最终要替换的关键字，混淆结束后，不删除，用于bug分析
REPLACEKEYWORDS="./replacekeys.txt"

#删除已经存在的临时文件
rm -f $SOURCECODEKEYWORDS
rm -f $REPLACEKEYWORDS
rm -f $RESKEYSALL
rm -f temp.res

#提取文件名列表
rm -f f.list
find $ROOTFOLDER -type f | sed "/\/\./d" >f.list
#根据要排除的文件目录，将文件列表分离
#Exclude=$(echo $EXCLUDE_DIR | sed "s/--exclude-dir\=//g" |sed "s/ $//g" | sed "s/[*.]//g" | sed "s/ /\\\|/g")
Exclude=$(echo $EXCLUDE_DIR | sed "s/--exclude-dir\=//g" |sed "s/ $//g" | sed "s/ /\\\|/g")
#保留文件列表
rm -f f_res.list
cat f.list | grep "$Exclude" >f_res.list
#混淆文件列表
rm -f f_rep.list
cat f.list | grep -v "$Exclude" >f_rep.list
rm -f f.list
#提取文件名
rm -f filter_file.txt
cat f_rep.list | awk -F/ '{print $NF;}'| awk -F. '{print $1;}' | sed "/^$/d" | sort | uniq >filter_file.txt

#从源代码目录中提取要过滤的函数关键字
rm -f filter_fun.txt
grep -h -r -I  "^[-+]" $ROOTFOLDER $EXCLUDE_DIR --include '*.[mh]' |sed "s/[+-]//g"|sed "s/[();,: *\^\/\{]/ /g"|sed "s/[ ]*</</"|awk '{split($0,b," ");print b[2];}'| sort|uniq |sed "/^$/d"|sed "/^init/d" >filter_fun.txt

#从源代码目录中提取要过滤的属性关键字
rm -f filter_property.txt
grep -r -h -I  ^@property $ROOTFOLDER  $EXCLUDE_DIR --include '*.[mh]' | sed "s/(.*)/ /g"  | sed "s/<.*>//g" |sed "s/[,*;]/ /g" | sed "s/IBOutlet/ /g" |awk '{split($0,s," ");print s[3];}'|sed "/^$/d" | sort |uniq >filter_property.txt

#从源代码目录中提取要过滤的类关键字
rm -f filter_class.txt
grep -h -r -I  "^@interface" $ROOTFOLDER  $EXCLUDE_DIR  --include '*.[mh]' | sed "s/[:(]/ /" |awk '{split($0,s," ");print s[2];}'|sort|uniq >filter_class.txt

#从源代码目录中提取要过滤的协议关键字
grep -h -r -I  "^@protocol" $ROOTFOLDER  $EXCLUDE_DIR  --include '*.[mh]'| sed "s/[\<,;].*$//g"|awk '{print $2;}' | sort | uniq >>filter_class.txt

#合并要过滤的关键字，并重新排序过滤
rm -f $SOURCECODEKEYWORDS
cat filter_fun.txt filter_property.txt filter_class.txt filter_file.txt |sed "/^$/d" | sort | uniq >$SOURCECODEKEYWORDS
rm -f filter_fun.txt
rm -f filter_class.txt
rm -f filter_file.txt

#自动获取保留字，工程名等
rm -f temp.res
cat `cat f_rep.list | grep project.pbxproj` | grep -w productName | sed "s/;//g"|awk '{print $NF;}'>temp.res
#提取要保留的文件名
cat f_res.list | awk -F/ '{print $NF;}'| awk -F. '{print $1;}' | sed "/^$/d" | sort | uniq >>temp.res
rm -f f_res.list
#合并自定义保留字
#判断自定义保留字文件是否存在，不存在即创建一个空的
if [ ! -f "$RESCUSTOM" ]; then
touch "$RESCUSTOM" 
fi
cat $RESERVEDKEYWORDS $RESCUSTOM temp.res | sort |uniq >$RESKEYSALL
rm -f temp.res

#过滤保留字，将需要混淆的关键字加密后写入文件
rm -f $REPLACEKEYWORDS
cat $SOURCECODEKEYWORDS |
while read line
do
if grep $line $RESKEYSALL
then
echo filter1: $line
else
#使用md5对关键字进行加密
md5 -r -s $line  | sed s/\"//g >> $REPLACEKEYWORDS
fi
done
rm -f $SOURCECODEKEYWORDS

#开始混淆，替换源代码中的关键字为加密后的,防止开头为数字的情况
cat $REPLACEKEYWORDS |
while read line
do
var1=$(echo "$line"|awk '{print "z"$1"m"}')
var2=$(echo "$line"|awk '{print $2}')
rm -f rep.tmp
if grep -r -n -I -w "[_]\{0,1\}$var2"  $ROOTFOLDER $EXCLUDE_DIR   --include="*.[mhc]" --include="*.mm" --include="*.pch" --include="*.storyboard" --include="*.xib" --include="*.nib" --include="contents" --include="*.pbxproj" >rep.tmp
then
cat rep.tmp |
while read -r l
do
#获取文件路径
v1=$(echo "$l"|cut -d: -f 1 )
#获取行号
v2=$(echo "$l"|cut -d: -f 2 )
#获取指定行数据
v3=$(sed -n "$v2"p "$v1")
##sed自带文件文本替换功能，不符合我们的期望，故放弃使用；有无适合的脚本命令，还希望脚本高手予以指点～
#sed -i '' ''"$v2"'s/'"$var2"'/'"$var1"'/g' $v1
#特殊字符转义替换，echo中 输出的变量 一定要加双引号！！！
v4=$(echo "$v3" | awk '{gsub(/"/, "\\\"", $0);gsub(/</, "\\\<", $0);gsub(/>/, "\\\>", $0);gsub(/\*/, "\\\*", $0);gsub(/\//, "\\\/", $0);gsub(/\[/, "\\\[", $0);gsub(/\]/, "\\\]", $0);gsub(/\{/, "\\\{", $0);gsub(/\}/, "\\\}", $0);gsub(/\&/, "\\\\\&", $0); print $0;}')
#单词替换
var3=$(./KYReplacewords.run "$v4" "$var2" "$var1")
#整行替换
sed -i '' "$v2"'s/.*/'"$var3"'/g' "$v1"
echo "step2:$l"
done
else
echo "step2:do not find:$var2"
fi
done
rm -f tmp.txt

#过滤保留字，用于属性设置函数混淆，将需要混淆的关键字加密后写入文件
rm -f repProperty.txt
cat filter_property.txt |
while read line
do
if grep $line $RESKEYSALL
then
echo filter1: $line
else
md5 -r -s $line  | sed s/\"//g >> repProperty.txt
fi
done
rm -f filter_property.txt

#开始混淆，替换属性前带下划线的地方
cat repProperty.txt |
while read line
do
ar=(`echo "$line"|cut -f 1-2 -d " "`)
lastFind=`echo _${ar[1]}`
lastRep=`echo _z${ar[0]}m`
rm -f rep.tmp
if grep -r -n -I -w "$lastFind"  $ROOTFOLDER $EXCLUDE_DIR   --include="*.[mhc]" --include="*.mm" --include="*.storyboard" --include="*.xib" >rep.tmp
then
cat rep.tmp |
while read l
do
v1=$(echo "$l"|cut -d: -f 1 )
v2=$(echo "$l"|cut -d: -f 2 )
sed -i '' ''"$v2"'s/'"$lastFind"'/'"$lastRep"'/g' $v1
echo "step3:"$l
done
else
echo "step3:do not find:"$lastFind
fi
done
rm -f rep.tmp

#开始混淆，替换属性设置函数
cat repProperty.txt |
while read line
do
ar=(`echo "$line"|cut -f 1-2 -d " "`)
first=`echo ${ar[1]}|cut -c -1| sed "y/abcdefghijklmnopqrstuvwxyz/ABCDEFGHIJKLMNOPQRSTUVWXYZ/"`
second=`echo ${ar[1]}|cut -c 2-`
lastFind=`echo set$first$second`
lastRep=`echo setZ${ar[0]}m`
rm -f rep.tmp
if grep -r -n -I -w "$lastFind"  $ROOTFOLDER $EXCLUDE_DIR   --include="*.[mhc]" --include="*.mm" --include="*.storyboard" --include="*.xib" >rep.tmp
then
cat rep.tmp |
while read l
do
v1=$(echo "$l"|cut -d: -f 1 )
v2=$(echo "$l"|cut -d: -f 2 )
sed -i '' ''"$v2"'s/'"$lastFind"'/'"$lastRep"'/g' $v1
echo "step3:"$l
done
else
echo "step3:do not find:"$lastFind
fi
done
rm -f rep.tmp
rm -f repProperty.txt

cat f_rep.list |
while read line
do
echo "old name:"$line
#获取文件名，带后缀
v1=$(echo "$line" | sed "s/\// /g" | awk '{print $NF}')
echo "v1="$v1
#获取文件名，不带后缀
v2=$(echo $v1 | sed "s/\./ /g" | awk '{print $1}')
echo "v2="$v2
if grep -w $v2 $RESKEYSALL
then
echo "find."
else
#获取后缀
v3=$(echo $v1 | sed "s/\./ /g" | awk '{print "."$2}')
echo "v3="$v3
#对不带后缀的文件名加密
v4=$(md5 -q -s "$v2" | sed "s/.*/z&m/g")
echo "v4="$v4
#获取路径
v5=$(echo "$line" | sed "s/"$v1"//g")
echo "v5="$v5
#修改文件名
mv $line $v5$v4$v3
echo "new name:"$v5$v4$v3
fi
done

rm -f f_rep.list
rm -f $RESKEYSALL

echo "###########################  恭喜您，代码混淆完成！###########################"
echo "###########################  运行混淆后的工程！###########################"

exit

在终端执行，切换到 KYConfuse.sh 所在目录，执行脚本

# ./KYConfuse.sh

即可，混淆工程的文件名,类名,协议名,属性名,函数名的混淆。

混淆后的工程如下：

程序员专栏 扫码关注填加客服 长按识别下方二维码进群

近期精彩内容推荐：

程序员违规操作损失800万，被判5年半！

“大多数人，都死在了 30 岁”

实用，5个案例让 Python 输出漂亮的表格

如何在分布式场景下生成全局唯一 ID ？

在看点这里好文分享给更多人↓↓

iOS_开发

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫