domingo, 14 de dezembro de 2014

O Dataset Jura

O dataset Jura consiste em um banco de dados de 359 poços perfurados na Suiça onde foram coletados dados de tipo de rocha, tipo de uso do solo e concentração de metais pesados por poço.

Esse conjunto de dados é de domínio público, estando incluído no pacote GSTAT.
Esse pacote deve ser instalado no Software R para se ter acesso aos dados. O dataset é carregado digitando-se no terminal do R:

data(jura)

Os dados estão estruturados em um dataframe. Nele constam uma amostra de treinamento (prediction.dat) e uma amostra de validação (validation.dat). A primeira, que vamos utilizar neste trabalho, consiste em uma tabela com os seguintes atributos: coordenada Xloc(km), coordenada Yloc(km), tipo de rocha (1 para Argoviano, 2 Kimmeridgiano, 3 Sequanianao, 4 Portlandiano e 5 Quartenário), uso do solo (1 Floresta, 2 Pasto, 3 Prado e 4 Lavoura) e teores de alguns metais pesados em ppm. A Tabela 1 mostra parte dos dados representativos da amostragem prediction.dat.

Xloc Yloc Landuse Rock Cd Co Cr Cu Ni Pb Zn
2.386 3.077 3 3 1.740 9.320 38.32 25.720 21.32 77.36 92.56
2.544 1.972 2 2 1.335 10.000 40.20 24.760 29.72 77.88 73.56
2.807 3.347 2 3 1.610 10.600 47.00 8.880 21.40 30.80 64.80
4.308 1.933 3 2 2.150 11.920 43.52 22.700 29.72 56.40 90.00


Tabela 1

Nenhum comentário:

Postar um comentário