O objetivo deste trabalho foi utilizar métodos estatísticos univariado e multivariado na seleção de variáveis independentes, em modelos matemáticos lineares para a estimativa da biomassa verde da haste principal do bambu, Bambusa vulgaris, visando reduzir tempo e custo sem perda de precisão, além de empregar alternativas para estimação na existência de multicolinearidade. Os dados foram provenientes de um experimento conduzido pela empresa Agroindustrial Excelsior S. A. (Agrimex) localizada no Engenho Itapirema na cidade de Goiana – PE. Foram utilizadas 450 hastes de bambu, que tiveram sua biomassa verde quantificada através do peso e 4 variáveis independentes medidas na mesma haste. Inicialmente, verificou-se a existência da multicolinearidade por meio da matriz de correlação das variáveis independentes e pelo fator de inflação da variância. Para seleção das variáveis independentes foram utilizados os métodos: Stepwise e Retenção por K componentes. As alternativas utilizadas foram a Regressão com os componentes principais e Regressão Ridge. No geral, em apenas uma situação os métodos de seleção de variáveis se comportam adequadamente na existência de multicolinearidade entre as variáveis explicativas, exatamente o método multivariado de retenção por K=3 componente pela matriz de covariância, modelo de Spurr. Os métodos alternativos de estimação conduzem respostas semelhantes, mesmo que possuindo estruturas diferentes, no entanto, a regressão com os componentes principais obteve os melhores resultados.
The objective of this work was to use univariate and multivariate statistical methods on selection of independent variables, in the mathematical linear models, to estimate the green biomass of the main bamboo rod, bambusa vulgaris, pursuing time and cost reduction without loss of precision. The data came from an experiment carried out for the Agroindustrial Excelsior S. A. (Agrimex) company located in the city of Goiana – PE.Quantified by its green biomass weight,450 bamboo rods were used and 4 independent variables measured in the rod. Initially, the effect of the multicollinearity could be verified through the correlation matrix of the independent variables and the varience inflation factors.To select the independent variables two methods were used: Stepwise and K component retention. The alternatives used were component regression and Ridge regression. In general, in only one situation the variable selection methods behave adequately while multicollinearity is present among the independent variables, that is the multivaried method of retention K=3 component for the covariate matrix, model of Spurr. The estimative of alternative methods showed similar responses, however, the principal component regression yields the best results.