Esse conjunto de dados é de domínio público, estando incluído no pacote GSTAT.
Esse pacote deve ser instalado no Software R para se ter acesso aos dados. O dataset é carregado digitando-se no terminal do R:
data(jura)
Os dados estão estruturados em um dataframe. Nele constam uma amostra de treinamento (prediction.dat) e uma amostra de validação (validation.dat). A primeira, que vamos utilizar neste trabalho, consiste em uma tabela com os seguintes atributos: coordenada Xloc(km), coordenada Yloc(km), tipo de rocha (1 para Argoviano, 2 Kimmeridgiano, 3 Sequanianao, 4 Portlandiano e 5 Quartenário), uso do solo (1 Floresta, 2 Pasto, 3 Prado e 4 Lavoura) e teores de alguns metais pesados em ppm. A Tabela 1 mostra parte dos dados representativos da amostragem prediction.dat.
Xloc | Yloc | Landuse | Rock | Cd | Co | Cr | Cu | Ni | Pb | Zn |
2.386 | 3.077 | 3 | 3 | 1.740 | 9.320 | 38.32 | 25.720 | 21.32 | 77.36 | 92.56 |
2.544 | 1.972 | 2 | 2 | 1.335 | 10.000 | 40.20 | 24.760 | 29.72 | 77.88 | 73.56 |
2.807 | 3.347 | 2 | 3 | 1.610 | 10.600 | 47.00 | 8.880 | 21.40 | 30.80 | 64.80 |
4.308 | 1.933 | 3 | 2 | 2.150 | 11.920 | 43.52 | 22.700 | 29.72 | 56.40 | 90.00 |
Tabela 1
Nenhum comentário:
Postar um comentário