De curând am scris despre cum să descarci toată Wikipedia ca să o citești din calculatorul tău. Când am văzut ditamai fișierul XML de 40GB după ce l-a extras WinRAR în cam 3 (trei) ore nu știam cum naiba pot să citesc Wikipedia offline din aia.
După scurte căutări am dat de Xowa, o aplicație care extrage informațiile din acel XML de 40GB și apoi îți prezintă Wikipedia în formatul deja cunoscut.
Citește Wikipedia offline cu Xowa
Xowa, nu numai că te lasă să citești pachetul de l-ai descărcat, dar îți permite să și descarci de pe net alte părți sau limbi din Wikipedia.
În cazul meu am avut deja fișierul în calculator așa că nu a mai trebuit să folosesc programul ca să descarce orice ar fi fost de descărcat.
După ce ai descărcat Xowa de aici, primești un fișier ZIP/RAR pe care trebuie să îl dezarhivezi într-un folder ales de tine. Apoi vei descoperi xowa.exe în acel folder. Vezi că ar putea fi xowa_64.exe, în funcție de ce ai ales la download.
După ce dai clic pe Xowa.exe, trebuie să mergi la Tools – Import from Script. Să nu uităm că vorbim aici despre faptul că avem fișierul XML de 40GB deja descărcat în PC:
După aceea trebuie să:
– alegi Read from file, la secțiunea Where to get the dump
– alegi Version 2, de la Category system
– la partea de Import alegi Generate Script, aștepți să se genereze un cod în căsuța de dedesubt, și apoi alegi Run script
– aștepți 3-5 ore până extrage conținutul din fișierul XML
După ce termină de extras conținutul te duci pe pagina principală a Xowa și alegi din stânga-jos simple.wikipedia.org. Job done!