編寫(xiě)高效簡(jiǎn)潔的C語(yǔ)言代碼,是許多軟件工程師追求的目標。本文就工作中的一些體會(huì )和經(jīng)驗做相關(guān)的闡述,不對的地方請各位指教。
第1招:以空間換時(shí)間
計算機程序中zui大的矛盾是空間和時(shí)間的矛盾,那么,從這個(gè)角度出發(fā)逆向思維來(lái)考慮程序的效率問(wèn)題,我們就有了解決問(wèn)題的第1招--以空間換時(shí)間。
例如:字符串的賦值。
方法A,通常的辦法:
#define LEN 32
char string1 [LEN];
memset (string1,0,LEN);
strcpy (string1,"This is an example!!"
方法B:
const char string2[LEN]="This is an example!"
char*cp;
cp=string2;
(使用的時(shí)候可以直接用指針來(lái)操作。)
從上面的例子可以看出,A和B的效率是不能比的。在同樣的存儲空間下,B直接使用指針就可以操作了,而A需要調用兩個(gè)字符函數才能完成。B的缺點(diǎn)在于靈活性沒(méi)有A好。在需要頻繁更改一個(gè)字符串內容的時(shí)候,A具有更好的靈活性;如果采用方法B,則需要預存許多字符串,雖然占用了 大量的內存,但是獲得了程序執行的高效率。
如果系統的實(shí)時(shí)性要求很高,內存還有一些,那我推薦你使用該招數。
該招數的邊招--使用宏函數而不是函數。舉例如下:
方法C:
#define bwMCDR2_ADDRESS 4
#define bsMCDR2_ADDRESS 17
int BIT_MASK (int_bf)
{
return ((IU<<(bw##_bf))-1)<<(bs##_bf);
}
void SET_BITS(int_dst,int_bf,int_val)
{
_dst=((_dst) & ~ (BIT_MASK(_bf)))I (((_val)<<<(bs##_bf))&(BIT_MASK(_bf)))
}
SET_BITS(MCDR2,MCDR2_ADDRESS,RegisterNumber);
方法D:
#define bwMCDR2_ADDRESS 4
#define bsMCDR2_ADDRESS 17
#define bmMCDR2_ADDRESS BIT_MASK (MCDR2_ADDRESS)
#define BIT_MASK(_bf)(((1U<<(bw##_bf))-1)<< (bs##_bf)
#define SET_BITS(_dst,_bf,_val) ((_dst)=((_dst)&~(BIT_MASK(_bf)))I (((_val)<<(bs##_bf))&(BIT_MASK(_bf))))
SET_BITS(MCDR2,MCDR2_ADDRESS,RegisterNumber);
函數和宏函數的區別就在于,宏函數占用了大量的空間,而函數占用了時(shí)間。大家要知道的是,函數調用是要使用系統的棧來(lái)保存數據的,如果編譯器里有棧檢查選項,一般在函數的頭會(huì )嵌入一些匯編語(yǔ)句對當前棧進(jìn)行檢查;同時(shí),CPU也要在函數調用時(shí)保存和恢復當前的現場(chǎng),進(jìn)行壓棧和彈棧操作,所以,函數調用需要一些CPU時(shí)間。而宏函數不存在這個(gè)問(wèn)題。宏函數僅僅作為預先寫(xiě)好的代碼嵌入到當前程序,不會(huì )產(chǎn)生函數調用,所以?xún)H僅是占用了空間,在頻繁調用同一個(gè)宏函數的時(shí)候,該現象尤其突出。
D方法是我看到的zui好的置位操作函數,是ARM公司源碼的一部分,在短短的三行內實(shí)現了很多功能,幾乎涵蓋了所有的位操作功能。C方法是其變體,其中滋味還需大家仔細體會(huì )。
第2招:數學(xué)方法解決問(wèn)題
現在我們演繹高效C語(yǔ)言編寫(xiě)的第 二招--采用數學(xué)方法來(lái)解決問(wèn)題。
數學(xué)是計算機之母,沒(méi)有數學(xué)的依據和基礎,就沒(méi)有計算機的發(fā)展,所以在編寫(xiě)程序的時(shí)候,采用一些數學(xué)方法 會(huì )對程序的執行效率有數量級的提高。
舉例如下,求1~100的和。
方法E
int I,j;
for (I=1; I<=100; I++){
j+=I;
}
方法F
int I;
I=(100*(1+100))/2
這個(gè)例子是我印象zui深的一個(gè)數學(xué)用例,是我的餓計算機啟蒙老師考我的。當時(shí)我只有小學(xué)三年級,可惜我當時(shí)不知道用公式Nx(N+1)/2來(lái)解決這個(gè)問(wèn)題。方法E循環(huán)了100次才解決問(wèn)題,也就是說(shuō)zui少用了100個(gè)賦值、100個(gè)判斷、200個(gè)加法(I和j);而方法F僅僅用了1個(gè)加法、1個(gè)乘法、1次除法。效果自然不言而喻。所以,現在我在編程序的時(shí)候,更多的是動(dòng)腦筋找規律,zui大限度地發(fā)揮數學(xué)的威力來(lái)提高程序運行的效率。
第3招:使用位操作
實(shí)現高效的C語(yǔ)言編寫(xiě)的第三招--使用位操作,減少除法和取模的運算。
在計算機程序中,數據的位是可以操作的zui小數據單位,理論上可以用“位運算”來(lái)完成所有的運算和操作。一般的位操作是用來(lái)控制硬件的,或者做數據變換使用,但是,靈活的位操作可以有效地提高程序運行的效率。舉例如下:
方法G
int I,J;
I=257/8;
J=456%32;
方法H
int I,J;
I=257>>3;
J=456-(456>>4<<4);
在字面上好象H比G麻煩了好多,但是,仔細查看產(chǎn)生的匯編代碼就會(huì )明白,方法 G調用了基本的取模函數和除法函數,既有函數調用,還有很多匯編代碼和寄存器參與運算;而方法H則僅僅是幾句相關(guān)的匯編,代碼更簡(jiǎn)潔、效率更高。當然,由于編譯器的不同,可能效率的差距不大,但是,以我目前遇到的MS C,ARM C來(lái)看,效率的差距還是不小。相關(guān)匯編代碼就不在這里列舉了。
運用這招需要注意的是,因為CPU的不同而產(chǎn)生的問(wèn)題。比如說(shuō),在PC上用這招編寫(xiě)的程序,并在PC上調試通過(guò),在移植到一個(gè)16位機平臺上的時(shí)候,可能會(huì )產(chǎn)生代碼隱患。所以只有在一定技術(shù)進(jìn)階的基礎下才可以使用這招。
第4招:匯編嵌入
高效C語(yǔ)言編程的必殺技,第四招--嵌入匯編。
“在熟悉匯編語(yǔ)言的人眼里,C語(yǔ)言編寫(xiě)的程序都是垃圾”。這種說(shuō)法雖然偏激了一些,但是卻有它的道理。匯編語(yǔ)言是效率zui高的計算機語(yǔ)言,但是,不可能靠著(zhù)它來(lái)寫(xiě)一個(gè)操作系統吧?所以,為了獲得程序的高效率,我們只好采用變通的方法--嵌入匯編、混合編程。
舉例如下,將數組一賦值給數組二,要求每一個(gè)字節都相符。char string1[1024], string2[1024];方法I
int I;
for (I=0; I<1024; I++)
*(string2+I)=*(string1+I)
方法J
#int I;
for(I=0; I<1024; I++)
*(string2+I)=*(string1+I);
#else
#ifdef_ARM_
_asm
{
MOV R0,string1
MOV R1,string2
MOV R2,#0
loop:
LDMIA R0!,[R3-R11]
STMIA R1!,[R3-R11]
ADD R2,R2,#8
CMP R2, #400
BNE loop
}
#endif
方法I是zui常見(jiàn)的方法,使用了1024次循環(huán);方法J則根據平臺不同做了區分,在A(yíng)RM平臺下,用嵌入匯編僅用128次循環(huán)就完成了同樣的操作。這里有朋友會(huì )說(shuō),為什么不用標準的內存拷貝函數呢?這是因為在源數據里可能含有數據為0的字節,這樣的話(huà),標準庫函數會(huì )提前結束而不會(huì )完成我們要求的操作。這個(gè)例程典型應用于LCD數據的拷貝過(guò)程。根據不同的CPU,熟練使用相應的嵌入匯編,可以大大提高程序執行的效率。
雖然是必殺技,但是如果輕易使用會(huì )付出慘重的代價(jià)。這是因為,使用了嵌入匯編,便限制了程序的可移植性,使程序在不同平臺移植的過(guò)程中,臥虎藏龍、險象環(huán)生!同時(shí)該招數也與現代軟件工程的思想相違背,只有在迫不得已的情況下才可以采用。切記。
使用C語(yǔ)言進(jìn)行高效率編程,我的體會(huì )僅此而已。在此已本文拋磚引玉,還請各位高手共同切磋。希望各位能給出更好的方法,大家一起提高我們的編程技巧。