對macbook或一些“力量”不足的小破本,靠nanoGPT也能開訓(xùn)。
不過,作者建議使用莎士比亞(shakespeare)數(shù)據(jù)集,該數(shù)據(jù)集前文已提及,大小約1MB,然后在一個很小的網(wǎng)絡(luò)上運行。
據(jù)他自己親身示范,創(chuàng)建了一個小得多的Transformer(4層,4個head,64嵌入大?。?,在作者自己的蘋果AIR M1本上,每次迭代大約需要400毫秒。
(GitHub上nanoGPT鏈接附在文末,有需要的朋友自?。?br />
One More Thing