Python用得到的黑魔法當(dāng)然是各種自省和動態(tài)綁定了。
舉個例子,Python可以重新綁定解釋器的excepthook,這樣當(dāng)程序異常結(jié)束時就可以做一些自定義的處理,我自己就一直拿這個配合ipdb進(jìn)行debug。用以下代碼聲明一個ExceptionHook:
class ExceptionHook :
instance = None
def __call__(self, *args, **kwargs) :
if self.instance is None:
from IPython.core import ultratb
self.instance = ultratb.FormattedTB(mode = "Plain", color_scheme = "Linux", call_pdb = 1)
return self.instance(*args, **kwargs)
然后
import sys
sys.exceptionhook = ExceptionHook()
重設(shè)完exceptionhook后,一旦你的代碼拋出異常,整個解釋器的環(huán)境都會被ipdb接管,然后就可以像交互模式下那樣使用了。通常我會在里面查一下棧,把必要的對象pickle一下,這樣以后復(fù)現(xiàn)錯誤也比較容易。
由于IPython是非GUI的程序,所以即便在SSH里也可以使用這招,完美解決SSH缺少IDE難以debug的窘境。
動態(tài)綁定的另一個用處,就是當(dāng)程序依賴一個修改過的庫時,可以把修改的部分剝離出來,在運行時動態(tài)綁定到對應(yīng)的庫上去就行。如果修改的是成員方法,需要這樣綁定:
from types import MethodType
def _foo(self, ...):
pass
obj.foo = MethodType(_foo, obj)
順帶提一下,pickle也是個非常好用的工具,盡管序列化并不是python的專利。pickle可以用來保存各種運行過程中的對象:
import pickle
pickle.dump(xxx, open("xxx.dump", "w"))
yyy = pickle.load(open("yyy.dump"))
pickle可以減少很多工作量,尤其是在復(fù)現(xiàn)bug時,把正確部分的運行結(jié)果pickle下來,這樣每次可以從pickle的位置開始運行。跑多個相似的baseline時也有很好的效果。不足的是pickle比較吃硬盤,pickle一堆東西后很容易就十幾個G了,而且pickle不能序列化動態(tài)生成的對象,比如lambda表達(dá)式或者上面提到的動態(tài)綁定產(chǎn)生的成員方法。
自省方面,Python可以通過dir()和help()函數(shù)分別取得對象下成員的列表和幫助,這個在找不到庫文檔的時候非常好用。只要開發(fā)者在函數(shù)下面寫了注釋,就能在help中看到。
除了上面提到的這些特性,python還有一堆小trick,其他回答里也提到了一些。雖然其中很多是語法糖,不過用好它們可以讓程序更pythonic:
1 類中用__slots__將成員靜態(tài)化,可以節(jié)省大量內(nèi)存。
2 裝飾器,常見用途如函數(shù)計時,亦可用來產(chǎn)生新的函數(shù)簽名。函數(shù)簽名會影響傳參檢查和ide補全,對帶不定長參數(shù)的函數(shù)非常有用。很多庫中都會用這種方法來兼容不同版本的API。
3 生成器,對于只需遍歷的數(shù)據(jù)可以節(jié)省大量內(nèi)存。
4 *和**參數(shù)展開。典型的例子是zip(*list_x)和chain(*list_x),分別相當(dāng)于轉(zhuǎn)置和concatenate。
5 if __name__ == "__main__": 檢查是否作為主程序調(diào)用,用multiprocessing并行時主程序得用這個框起來。
6 enumerate,例如將一個list變成list2index可以用dict([(x, i) for i, x in enumerate(list_x)])
7 namedtuple,生成類似于C語言的結(jié)構(gòu)體,同時支持tuple的所有語法。
8 defaultdict,做統(tǒng)計時不用初始化的dict,可以用lambda實現(xiàn)嵌套構(gòu)造defaultdict(lambda : defaultdict(int)),甚至遞歸字典tree = lambda : defaultdict(tree)。