VAASAN YLIOPISTO

Tiedostojen pakkaaminen UNIXissa

Kotihakemistoille on varattu levytilaa rajallisesti. Opiskelijoita tämä saattaa koskettaa viimeistään silloin, kun tutkielmaa varten on käsiteltävä suurempaa datatiedostoa. Komennolla quota -v saa selville, paljonko kotihakemiston l evytilasta on käytössä. Levytilan säästämiseksi suuret tiedostot kannattaa pakata. Pakkaamiseen käytetään mm. gzip- ja compress -käskyjä. Esimerkki tiedoston Data.dat pakkaamisesta selvittää asiaa:

	Pakkaamaton tiedosto: Data.dat
	Pakkaus gzipillä: gzip Data.dat
	Pakattu tiedosto: Data.dat.gz
	Purkaminen: gunzip Data.dat.gz

tai:	Pakkaamaton tiedosto: Data.dat
	Pakkaus compressilla: compress Data.dat
	Pakattu tiedosto: Data.dat.Z
	Purkaminen: uncompress Data.dat.Z
Tiedostoa käsiteltäessä pakattu tiedosto on aina purettava. Toisinaan levytila ei riitä tämän tekemiseen kotihakemistossa. Tätä varten on poijussa olemassa ns. scratch-levy. Siellä on (yleensä) levytilaa riittävästi suurempienkin töiden suorittamiseen. Tiedostot eivät kuitenkaan säily scratchissä, vaan ne poistetaan automaattisesti tietyn ajan kuluttua. Tämä aika on kuormituksesta riippuen vuorokaudesta jopa viikkoihin. Siksi tehtyjen ajojen tulokset ja muutetut tiedostot kannattaa kopioida talteen omaan kotihakemistoon. Tämän jälkeen tulisi scratchissä olevat tiedostot poistaa. Opiskelijoille on yleensä tehty valmiiksi omat alihakemistot scratchiin. Voit tarkistaa tämän komennolla cd /poiju/scratch/käyttäjätunnus (Käytät luonnollisesti omaa käyttäjätunnustasi.) Jos kone ei herjaa, vaan ruudulle tulee normaalisti prompti reimari> tai poiju>, sinulla on jo olemassa alihakemisto, ja se on nyt oletushakemistosi. Pääset takaisin omaan kotihakemistoosi komennolla cd. Seuraavan ohjeen avulla siirrät pakatun tiedoston (tässä Data.dat.gz) kotihakemistostasi scratchiin, teet tarvittavat ajot ja siirrät tulokset jälleen kotihakemistoosi:
	(Alussa olet kotihakemistossasi, jonka polun näet komennolla pwd)
	tiedoston siirto scratchiin: 
		cp Data.dat.gz /poiju/scratch/käyttäjätunnus
	scratch oletushakemistoksi:
		cd /poiju/scratch/käyttäjätunnus
	(hakemiston sisällön näet aina komennolla ls -l)
	Data.dat.gz:n purkaminen:
		gunzip Data.dat.gz
	Nyt pystyt käsittelemään tiedostoa. Voit esim. selata sitä, tehdä
	SAS-ajoja jne.
	Tiedoston pakkaus uudelleen (muista pakata myös suuret tulostiedostot):
		gzip Data.dat
	Siirto kotihakemistoon:
		cp Data.dat.gz kotihakemisto
	Tiedostojen tuhoaminen scratchistä: 
		rm Data.dat.gz
	Paluu kotihakemistoon:
		cd

Sivu on päivitetty viimeksi 10.12.2009.
http://www.uwasa.fi/~jaty/yleisinfo/pakkaus.html

Takaisin Takaisin tietokantojen otsikkosivulle.

[Vaasan yliopisto] [Laskentatoimi ja rahoitus] [Laskentatoimen ja rahoituksen tietokannat]