iOS应用安全之代码混淆

Python实战社群

Java实战社群

长按识别下方二维码,按需求添加

扫码关注添加客服

进Python社群▲

扫码关注添加客服

进Java社群

作者 | kingly 
来源 | Github

https://github.com/kingly09/KYSecurityDefense/blob/master/README_hx.md

01 理论

iOS应用安全随着各种事件的曝出,越来越受到重视。那针对iOS应用安全方面能做点什么呢?如何让我们开发的应用更安全一点呢?要知道如何才能安全,就要了解iOS应用怎么就不安全了呢?现在随着越狱技术的提高和各种工具的完善,使得逆向分析一款iOS应用变成了一个轻而易举的事情。因此,要使的iOS应用更安全,那就从逆向工程的各个阶段进行层层阻拦。当然,这个只是增加逆向到难度而已~。

iOS应用逆向分析分为静态分析和动态分析。分析的前提是先有一部越狱过的设备,然后再应用去壳,将去壳后的应用利用工具 class-dump导出头文件(先透漏下,本文就是针对它的,哈哈~),用于分析程序逻辑及设计实现,利用IDA 或Hoper进行反汇编。以上两种方法为静态分析。利用LLDB对应用进行动态调试验证,那这个方法就是动态分析了。逆向的事也不多说了(就知道这些-_-|),本文的设计就是为了增加导出头文件分析的难度,让逆向人员看着头文件两眼冒金星~~

为了达到看一眼两眼冒金星的效果,现打算将以下内容进行混淆:

1.文件名

2.类名

3.协议名

4.属性名

5.函数名

元芳,你怎么看?将以上内容混淆后,然后编译发布。这样使用 class-dump导出的头文件,应该也是混淆后的了。这样也就达到了我们的目的。

采用何种方式混淆呢?混淆无非就是将原来字解释的关键字变的不可读,那就简单点,直接调用系统自带的md5加密算法加密就可以了。

那混淆就简单的很了,混淆看来是指日可待了~

混淆原理:将以上需要混淆的内容关键字提取去来,然后md5加密,然后再替换工程中出现的关键字。

原理很简单,要考虑哪些问题呢?

1.如何提取关键字?

2.混淆算法就简单了,这个不是问题...

3.混淆后的关键字,怎么替换原来的关键字呢?

4.混淆后的工程还要还原回去吗?

5.混淆程序采用何种方式实现?

...

1.如何提取关键字?

提取关键字,当然是根据各种关键字自己的特性使用工具自动完成提取的。人工提取那还不疯了!!!如果工具提取,那符合规则的关键字包括系统的,不就都提取出来了?这样程序还能编译通过吗?也就是说提取关键字,只能提取自定义的,不能把系统自己生成的或使用的也提取出来。这个有点麻烦~~~~~。

2.混淆算法

md5,这个是不可逆的,所以混淆后,要保留关键字和加密后的对应表,方便后续排除bug用。

3.混淆后的关键字,怎么替换原来的关键字呢?

这个当然是使用工具批量替换了,如果遇到以下情况怎么办?

原字符串:“This is my fish.” 要将is” 替换为”is not“。我们希望的当然是:“This is not my fish.” 而不是“This not is not my fis noth.” 。也就是说,要达到想要的目的,必须是单词匹配替换,这个很重要。

4.混淆后的工程还要还原回去吗?

能混淆,当然能还原回去,但是好像没有必要哦~~,那就不考虑还原回去了,我的地盘听我的,呵呵。

5.混淆程序采用何种方式实现?

首先当然是脚本了,命令行工具丰富的很,拿来用即可。只是可惜,还要一个个学习而已。

还整点啥景呢?没了就开始整呗~

02 实现

针对设计篇描述的大致思路,现在针对各个问题点,给出实现方法

该脚本大致使用的工具如下:vi、grep、sed、find、awk、cut、sort、uniq、cat、md5等。

针对要加密的内容,分别给出关键字提取脚本命令。

脚本中 $ROOTFOLDER 代表工程根目录,$EXCLUDE_DIR 代表要排除的目录,举例如下:

    ROOTFOLDER="demoProject"
    EXCLUDE_DIR="--exclude-dir=*.framework --exclude-dir=include --exclude-dir=libraries --exclude-dir=Libs --exclude-dir=lib"

关键字提取

1.文件名

第一步先将包含路径的文件名写入文件

find $ROOTFOLDER -type f | sed "/\/\./d" >f.list

第二步文件中提取文件名

cat f_rep.list | awk -F/ '{print $NF;}'| awk -F. '{print $1;}' | sed "/^$/d" | sort | uniq

但从文件名提取的功能上,上面两个步骤完全可以合并为一步,但是在实际功能实现中还是要求将上面分为两步的

2.类名
grep -h -r -I  "^@interface" $ROOTFOLDER  $EXCLUDE_DIR  --include '*.[mh]' | sed "s/[:(]/ /" |awk '{split($0,s," ");print s[2];}'|sort|uniq

其中sort,排序;uniq 去除重复的。

3.协议名
grep -h -r -I  "^@protocol" $ROOTFOLDER  $EXCLUDE_DIR  --include '*.[mh]'| sed "s/[\<,;].*$//g"|awk '{print $2;}' | sort | uniq
4.属性名
grep -r -h -I  ^@property $ROOTFOLDER  $EXCLUDE_DIR --include '*.[mh]' | sed "s/(.*)/ /g"  | sed "s/<.*>//g" |sed "s/[,*;]/ /g" | sed "s/IBOutlet/ /g" |awk '{split($0,s," ");print s[3];}'|sed "/^$/d" | sort |uniq

其中

sed "/^$/d"  

是去除空行。

5.函数名
grep -h -r -I  "^[-+]" $ROOTFOLDER $EXCLUDE_DIR --include '*.[mh]' |sed "s/[+-]//g"|sed "s/[();,: *\^\/\{]/ /g"|sed "s/[ ]*</</"|awk '{split($0,b," ");print b[2];}'| sort|uniq |sed "/^$/d"|sed "/^init/d"  

函数名提取,目前只是提取函数名第一段的名称,如:

-(void)funName:(NSString *)param1 secondParam:(NSString *)param2;

那么该脚本只会提取出funName。脚本中

是将函数中的以 init开头的函数去除,因为,oc中初始化函数默认是以init`开头的,如果把该类的函数也混淆的话,会有问题的。

那么,以上脚本即可实现各种关键词的收集,收集后合并成一个文件,然后再排序去重复。

小小结

上述脚本提取出来的关键字包括系统自带的,也包括我们自己自定添加的,如果全部拿出混淆,那么我们混淆后的程序肯定是无法运行的,甚至无法通过编译。那么我们该怎么办?这个问题就是设计篇中提出的比较麻烦多事。最容易想到点方法就是,判断该关键字是否是系统自用的,如果是就不去混淆,相反就去混淆。那怎么系统用了哪些关键字?简单的很了,就是用上述提到的脚本,将系统使用的关键字,提取出来,作为系统自用的保留字。这样用排除法就可以解决这个麻烦的问题了,虽然比较笨拙,但是管用。

那么第一步就需要制作一个系统保留字字典库。用上述脚本即可完成。

那么第二步就是提取要替换的关键字,同样是用上述脚本,仔细看,你会发现个问题。提取文件名的时候,是将所有文件名都提取出来了,包括排除的目录,因此,在这个地方会有问题。我们要在文件名提取时,排除已经排除的目录或者将排除的目录文件名作为临时保留字。

过滤并加密保留字

将以上两步获取的关键字进行过滤。

    cat $SOURCECODEKEYWORDS |
    while read line
    do
    if grep $line $RESKEYSALL  
    then  
    echo filter1: $line  
    else  
    md5 -r -s $line  | sed s/\"//g >> $REPLACEKEYWORDS
    fi
    done

其中$SOURCECODEKEYWORDS是从ROOTFOLDER中提取的要混淆的关键字

替换工程中关键字

该步骤是本功能的核心,要实现文件中的关键字替换,不对,准确的说,应该是文件中的关键字单词替换。这个就是设计篇中提到的问题。

愿字符串:"This is my fish.” 要将is” 替换为”is not“。我们希望的当然是:“This is not my fish.” 而不是“This not is not my fis noth.” 。也就是说,要达到想要的目的,必须是单词匹配替换,这个很重要。经过实践证明,OS X版的sed并没有实现单词匹配替换,只能是将匹配正则表达式的行,进行字符串替换,也就是替换后是我们不想要的结果。这个可肿么办?还好经过一番挖掘,找到一种比较笨拙的办法,效果如下,又要发挥愚公精神了。

    sed -i '' '
    '"$v2"'s/)'"$var2"':/)'"$var1"':/g
    '"$v2"'s/('"$var2"':/('"$var1"':/g
    '"$v2"'s/ '"$var2"':/ '"$var1"':/g
    '"$v2"'s/\"'"$var2"':/\"'"$var1"':/g
    ' $v1  

其中,v2代表行号;var2代表要替换的关键字,即例子中的“is”;var1是混淆后的字符串;v1 是指文件路径,包括文件名;-i表示直接修改文件,后面必须带两个单引号,要不然会有错误,单引号内容应该是要备份的文件名,在此不需要备份所以为空;在第一行和最后一行之间的意思是,描述单词出现时的各种场景,要想达到单词匹配的效果,那就在此必须列举所有情景,这个真够蛋疼的~~,愚公上吧!!!

替换属性设置方法

    cat repProperty.txt |
    while read line
    do  
    ar=(`echo "$line"|cut -f 1-2 -d " "`)
    first=`echo ${ar[1]}|cut -c -1| sed "y/abcdefghijklmnopqrstuvwxyz/ABCDEFGHIJKLMNOPQRSTUVWXYZ/"`
    second=`echo ${ar[1]}|cut -c 2-`
    lastFind=`echo set$first$second`
    lastRep=`echo setZ${ar[0]}m`
    rm -f rep.tmp
    if grep -r -n -I -w "$lastFind"  $ROOTFOLDER $EXCLUDE_DIR   --include="*.[mhc]" --include="*.mm" --include="*.storyboard" --include="*.xib" >rep.tmp
    then  
    cat rep.tmp |
    while read l
    do  
    v1=$(echo "$l"|cut -d: -f 1 )
    v2=$(echo "$l"|cut -d: -f 2 )
    sed -i '' ''"$v2"'s/'"$lastFind"'/'"$lastRep"'/g' $v1  
    echo "step3:"$l  
    done  
    else  
    echo "step3:do not find:"$lastFind  
    fi  
    done  

这个也是相对比较麻烦的,因为oc的属性系统是可以自动合成setter函数的,所以属性的混淆需要额外多考虑点。上面的做法是,根据提取的过滤后的属性关键字,生成属性设置函数,然后查找过程中是否有用到,有就混淆掉。

文件名混淆

    cat f_rep.list |
    while read line
    do
    echo "old name:"$line  
    v1=$(echo "$line" | sed "s/\// /g" | awk '{print $NF}')
    echo "v1="$v1  
    v2=$(echo $v1 | sed "s/\./ /g" | awk '{print $1}')
    echo "v2="$v2  
    if grep -w $v2 $RESKEYSALL  
    then  
    echo "find."  
    else  
    v3=$(echo $v1 | sed "s/\./ /g" | awk '{print "."$2}')
    echo "v3="$v3  
    v4=$(md5 -q -s "$v2" | sed "s/.*/z&m/g")
    echo "v4="$v4  
    v5=$(echo "$line" | sed "s/"$v1"//g")
    echo "v5="$v5  
    mv $line $v5$v4$v3  
    echo "new name:"$v5$v4$v3  
    fi
    done

文件名混淆的原理就是将需要混淆的文件路径,提取出要混淆的部分,然后组合成最终的文件名,使用mv命令完成文件名混淆。

至此,设计篇中提及的要混淆的内容已经全部完成混淆。

注意事项

1.需要将工程名称作为临时保留关键字

如:工程名称demoProject,那么demoProject要作为保留字,否则混淆后,可能target的名称也会被混淆掉,这个不是我们期望的;

2.需要将工程中的子目录名称作为临时保留关键字

如:在工程目录下有子文件夹AFNetworking,在Xcode工程的导航里也可以看到AFNetworking的分组,此时,如果AFNetworking也被混淆,那么工程中的分组会变成混淆后的字符串,但是工程目录下的子文件夹AFNetworking并没有改变,所以此时,会找不到响应的文件;根本原因是我们的混淆没有对文件夹名进行混淆。

3.需要将访问网络时组织的参数名称作为临时保留关键字

如:有一个属性名为:passport;恰好在组织网络参数时,有一个字段也叫passport,如果作为属性关键字passport被混淆了,那么组织网络参数时用的passport也会被混淆掉,所以此时传给后台的关键字passport就变了,导致后台无法识别;因此,出现这个情况时,要添加到临时的保留字中;如果编码规范的话,不用添加临时保留字也会避免~

4......

03 使用

全部 KYConfuse.sh ,实现代码如下:

#!/bin/bash
echo "#########################################"
echo  "File Name:KYConfuse.sh  "
echo  "Copyright (c) 2018 KYConfuse"
echo  "Email:362108564@qq.com"
echo  "Create:2018.05.28"
echo "#######################################"
echo "用户修改区-开始"
#要替换的源代码所在的根目录,该脚本文件与根目录处于同级文件夹
ROOTFOLDER="KYSecurityDefenseDemo"
#要排除的文件夹,例如demo中用到的第三方库AFNetworking,pods的第三方库等
EXCLUDE_DIR=" --exclude-dir=Pods --exclude-dir=buildAppstore --exclude-dir=Carthage --exclude-dir=Images.xcassets  --exclude-dir=Assets.xcassets  --exclude-dir=Certificates --exclude-dir=fastlane --exclude-dir=fastlanelog"
echo "用户修改区-结束"

#自定义的保留关键字,相当与白名单,添加到该文件中,一行一个,加入该文件的关键字将不被混淆;如工程中自定义的文件夹名称
RESCUSTOM="resCustom.txt"

#保留关键字文件不可删除
RESERVEDKEYWORDS="./reskeys.txt"
#最终的保留关键字=保留关键字+文件名
RESKEYSALL="./reskeysall.txt"
#提取的所有关键字
SOURCECODEKEYWORDS="./srckeys.txt"
#过滤后,最终要替换的关键字,混淆结束后,不删除,用于bug分析
REPLACEKEYWORDS="./replacekeys.txt"

#删除已经存在的临时文件
rm -f $SOURCECODEKEYWORDS
rm -f $REPLACEKEYWORDS
rm -f $RESKEYSALL
rm -f temp.res

#提取文件名列表
rm -f f.list
find $ROOTFOLDER -type f | sed "/\/\./d" >f.list
#根据要排除的文件目录,将文件列表分离
#Exclude=$(echo $EXCLUDE_DIR | sed "s/--exclude-dir\=//g" |sed "s/ $//g" | sed "s/[*.]//g" | sed "s/ /\\\|/g")
Exclude=$(echo $EXCLUDE_DIR | sed "s/--exclude-dir\=//g" |sed "s/ $//g" | sed "s/ /\\\|/g")
#保留文件列表
rm -f f_res.list
cat f.list | grep "$Exclude" >f_res.list
#混淆文件列表
rm -f f_rep.list
cat f.list | grep -v "$Exclude" >f_rep.list
rm -f f.list
#提取文件名
rm -f filter_file.txt
cat f_rep.list | awk -F/ '{print $NF;}'| awk -F. '{print $1;}' | sed "/^$/d" | sort | uniq >filter_file.txt

#从源代码目录中提取要过滤的函数关键字
rm -f filter_fun.txt
grep -h -r -I  "^[-+]" $ROOTFOLDER $EXCLUDE_DIR --include '*.[mh]' |sed "s/[+-]//g"|sed "s/[();,: *\^\/\{]/ /g"|sed "s/[ ]*</</"|awk '{split($0,b," ");print b[2];}'| sort|uniq |sed "/^$/d"|sed "/^init/d" >filter_fun.txt

#从源代码目录中提取要过滤的属性关键字
rm -f filter_property.txt
grep -r -h -I  ^@property $ROOTFOLDER  $EXCLUDE_DIR --include '*.[mh]' | sed "s/(.*)/ /g"  | sed "s/<.*>//g" |sed "s/[,*;]/ /g" | sed "s/IBOutlet/ /g" |awk '{split($0,s," ");print s[3];}'|sed "/^$/d" | sort |uniq >filter_property.txt

#从源代码目录中提取要过滤的类关键字
rm -f filter_class.txt
grep -h -r -I  "^@interface" $ROOTFOLDER  $EXCLUDE_DIR  --include '*.[mh]' | sed "s/[:(]/ /" |awk '{split($0,s," ");print s[2];}'|sort|uniq >filter_class.txt

#从源代码目录中提取要过滤的协议关键字
grep -h -r -I  "^@protocol" $ROOTFOLDER  $EXCLUDE_DIR  --include '*.[mh]'| sed "s/[\<,;].*$//g"|awk '{print $2;}' | sort | uniq >>filter_class.txt

#合并要过滤的关键字,并重新排序过滤
rm -f $SOURCECODEKEYWORDS
cat filter_fun.txt filter_property.txt filter_class.txt filter_file.txt |sed "/^$/d" | sort | uniq >$SOURCECODEKEYWORDS
rm -f filter_fun.txt
rm -f filter_class.txt
rm -f filter_file.txt

#自动获取保留字,工程名等
rm -f temp.res
cat `cat f_rep.list | grep project.pbxproj` | grep -w productName | sed "s/;//g"|awk '{print $NF;}'>temp.res
#提取要保留的文件名
cat f_res.list | awk -F/ '{print $NF;}'| awk -F. '{print $1;}' | sed "/^$/d" | sort | uniq >>temp.res
rm -f f_res.list
#合并自定义保留字
#判断自定义保留字文件是否存在,不存在即创建一个空的
if [ ! -f "$RESCUSTOM" ]; then
touch "$RESCUSTOM" 
fi
cat $RESERVEDKEYWORDS $RESCUSTOM temp.res | sort |uniq >$RESKEYSALL
rm -f temp.res

#过滤保留字,将需要混淆的关键字加密后写入文件
rm -f $REPLACEKEYWORDS
cat $SOURCECODEKEYWORDS |
while read line
do
if grep $line $RESKEYSALL
then
echo filter1: $line
else
#使用md5对关键字进行加密
md5 -r -s $line  | sed s/\"//g >> $REPLACEKEYWORDS
fi
done
rm -f $SOURCECODEKEYWORDS

#开始混淆,替换源代码中的关键字为加密后的,防止开头为数字的情况
cat $REPLACEKEYWORDS |
while read line
do
var1=$(echo "$line"|awk '{print "z"$1"m"}')
var2=$(echo "$line"|awk '{print $2}')
rm -f rep.tmp
if grep -r -n -I -w "[_]\{0,1\}$var2"  $ROOTFOLDER $EXCLUDE_DIR   --include="*.[mhc]" --include="*.mm" --include="*.pch" --include="*.storyboard" --include="*.xib" --include="*.nib" --include="contents" --include="*.pbxproj" >rep.tmp
then
cat rep.tmp |
while read -r l
do
#获取文件路径
v1=$(echo "$l"|cut -d: -f 1 )
#获取行号
v2=$(echo "$l"|cut -d: -f 2 )
#获取指定行数据
v3=$(sed -n "$v2"p "$v1")
##sed自带文件文本替换功能,不符合我们的期望,故放弃使用;有无适合的脚本命令,还希望脚本高手予以指点~
#sed -i '' ''"$v2"'s/'"$var2"'/'"$var1"'/g' $v1
#特殊字符转义替换,echo中 输出的变量 一定要加双引号!!!
v4=$(echo "$v3" | awk '{gsub(/"/, "\\\"", $0);gsub(/</, "\\\<", $0);gsub(/>/, "\\\>", $0);gsub(/\*/, "\\\*", $0);gsub(/\//, "\\\/", $0);gsub(/\[/, "\\\[", $0);gsub(/\]/, "\\\]", $0);gsub(/\{/, "\\\{", $0);gsub(/\}/, "\\\}", $0);gsub(/\&/, "\\\\\&", $0); print $0;}')
#单词替换
var3=$(./KYReplacewords.run "$v4" "$var2" "$var1")
#整行替换
sed -i '' "$v2"'s/.*/'"$var3"'/g' "$v1"
echo "step2:$l"
done
else
echo "step2:do not find:$var2"
fi
done
rm -f tmp.txt

#过滤保留字,用于属性设置函数混淆,将需要混淆的关键字加密后写入文件
rm -f repProperty.txt
cat filter_property.txt |
while read line
do
if grep $line $RESKEYSALL
then
echo filter1: $line
else
md5 -r -s $line  | sed s/\"//g >> repProperty.txt
fi
done
rm -f filter_property.txt

#开始混淆,替换属性前带下划线的地方
cat repProperty.txt |
while read line
do
ar=(`echo "$line"|cut -f 1-2 -d " "`)
lastFind=`echo _${ar[1]}`
lastRep=`echo _z${ar[0]}m`
rm -f rep.tmp
if grep -r -n -I -w "$lastFind"  $ROOTFOLDER $EXCLUDE_DIR   --include="*.[mhc]" --include="*.mm" --include="*.storyboard" --include="*.xib" >rep.tmp
then
cat rep.tmp |
while read l
do
v1=$(echo "$l"|cut -d: -f 1 )
v2=$(echo "$l"|cut -d: -f 2 )
sed -i '' ''"$v2"'s/'"$lastFind"'/'"$lastRep"'/g' $v1
echo "step3:"$l
done
else
echo "step3:do not find:"$lastFind
fi
done
rm -f rep.tmp

#开始混淆,替换属性设置函数
cat repProperty.txt |
while read line
do
ar=(`echo "$line"|cut -f 1-2 -d " "`)
first=`echo ${ar[1]}|cut -c -1| sed "y/abcdefghijklmnopqrstuvwxyz/ABCDEFGHIJKLMNOPQRSTUVWXYZ/"`
second=`echo ${ar[1]}|cut -c 2-`
lastFind=`echo set$first$second`
lastRep=`echo setZ${ar[0]}m`
rm -f rep.tmp
if grep -r -n -I -w "$lastFind"  $ROOTFOLDER $EXCLUDE_DIR   --include="*.[mhc]" --include="*.mm" --include="*.storyboard" --include="*.xib" >rep.tmp
then
cat rep.tmp |
while read l
do
v1=$(echo "$l"|cut -d: -f 1 )
v2=$(echo "$l"|cut -d: -f 2 )
sed -i '' ''"$v2"'s/'"$lastFind"'/'"$lastRep"'/g' $v1
echo "step3:"$l
done
else
echo "step3:do not find:"$lastFind
fi
done
rm -f rep.tmp
rm -f repProperty.txt

cat f_rep.list |
while read line
do
echo "old name:"$line
#获取文件名,带后缀
v1=$(echo "$line" | sed "s/\// /g" | awk '{print $NF}')
echo "v1="$v1
#获取文件名,不带后缀
v2=$(echo $v1 | sed "s/\./ /g" | awk '{print $1}')
echo "v2="$v2
if grep -w $v2 $RESKEYSALL
then
echo "find."
else
#获取后缀
v3=$(echo $v1 | sed "s/\./ /g" | awk '{print "."$2}')
echo "v3="$v3
#对不带后缀的文件名加密
v4=$(md5 -q -s "$v2" | sed "s/.*/z&m/g")
echo "v4="$v4
#获取路径
v5=$(echo "$line" | sed "s/"$v1"//g")
echo "v5="$v5
#修改文件名
mv $line $v5$v4$v3
echo "new name:"$v5$v4$v3
fi
done

rm -f f_rep.list
rm -f $RESKEYSALL

echo "###########################  恭喜您,代码混淆完成!###########################"
echo "###########################  运行混淆后的工程!###########################"

exit

在终端执行,切换到 KYConfuse.sh 所在目录,执行脚本

# ./KYConfuse.sh

即可,混淆工程的文件名,类名,协议名,属性名,函数名的混淆。

混淆后的工程如下:

程序员专栏 扫码关注填加客服 长按识别下方二维码进群

近期精彩内容推荐:  

 程序员违规操作损失800万,被判5年半!

 “大多数人,都死在了 30 岁”

 实用,5个案例让 Python 输出漂亮的表格

 如何在分布式场景下生成全局唯一 ID ?

在看点这里好文分享给更多人↓↓

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值