Comissão
Estatuto
Histórico
Localização
Contato
BIQ
BIBLIOTECA DO INSTITUTO DE QUÍMICA
UNICAMP

 
TESE DE DOUTORADO
 
Autor: Reis, Marlon Martins dos
Título: Desenvolvimento e Aplicação de Métodos Quimiométricos de Ordem Superior
Ano: 2002
Orientadora: Profa. Dra. Márcia M. C. Ferreira
Departamento: Físico-Química
Palavras-chave: Métodos em multi modos, RBL, NBRA, PARAFAC-TUCKER
Resumo: Dois dos métodos em multi modos apresentados neste trabalho, foram desenvolvidos na psicometria para estudos psicológicos. Para sua aplicação em dados químicos estes métodos requerem alguns refinamentos para acomodar variações inerentes aos dados químicos. Mesmo com o desenvolvimento deste tipo de refinamento, há alguns tipos de variação nestes dados que não podem ser descritos pelos métodos em multi modos. Neste sentido, o principal foco deste trabalho está voltado para a relação entre a parte dos dados que pode ser descrita e aquela que não pode ser pelos métodos em multi modos, em outras palavras, como se pode extrair uma informação útil de um conjunto de dados em multi modos. Três são os tópicos estudados: Calibração de segunda ordem; resolução de curvas; e análise exploratória em multi modos. Na calibração de segunda ordem é avaliado como o ambiente experimental influencia na estrutura em multi modos dos dados e como isto afeta os resultados da calibração. Na resolução de curvas, a variação presente nos dados, que não pode ser acomodada pelos métodos, interfere na escolha do número de curvas a serem resolvidas. Sendo assim, um procedimento de validação é apresentado para efetuar tal escolha. Em análise exploratória dois problemas são estudados. No primeiro, é sugerida uma metodologia para separar a parte dos dados que pode ser descrita daquela que não pode ser descrita pelos métodos. No segundo, um problema similar ao primeiro é estudado sendo usado um método para a suavização de curvas. Com a atual popularidade dos instrumentos de segunda ordem (hifenados), há agora um número de técnicas quimiométricas para a chamada calibração de segunda ordem, i.e. quantificação de um analito de interesse na presença de um (ou mais) interferente(s). Instrumentos de segunda ordem produzem dados de complexidade variada, sendo um fenômeno particular a sobreposição de posto (ou deficiência de posto), onde o posto dos dados não é igual à soma dos valores de posto das espécies que contribuem para a medida instrumental. Uma das propostas deste trabalho é avaliar o desempenho de dois métodos de calibração de ordem superior, um baseado em uma solução de um problema de autovalores-autovetores e outro em uma aproximação por quadrados mínimos, em termos de sua habilidade de quantificar o analito de interesse e sua estabilidade, quando aplicados em dados de injeção em fluxo com sobreposição de posto. Na presença de alta colinearidade dos dados, o método baseado em uma aproximação por quadrados mínimos apresenta resultados um pouco melhores e mais estáveis. A análise de componentes em dois modos (TMCA) é empregada na investigação do porque da diferença entre os resultados destes dois métodos em termos das propriedades químicas das espécies analisadas. O sucesso da calibração de segunda ordem está, em geral, fortemente associada aos valores de pKa dos compostos estudados. A identificação de cromóforos em amostras biológicas demanda a separação física dos composto presentes nestas amostras. Embora várias vantagens, na identificação de substâncias, tenham sido geradas pelo uso das técnicas espectroscópicas hifenadas, misturas complexas de cromóforos que apresentam espectros sobrepostos que não podem ser identificados diretamente. Este trabalho apresenta uma aplicação quimiométrica para identificação de compostos em amostras biológicas através de uma técnica espectroscópica hifenada. O método PARAFAC, que não possui problema de rotação livre, é usado para a resolução de curvas de espectros de emissão-excitação coletados a partir de amostras de tártaro dentário humano. O PARAFAC foi aplicado sob restrição (i.e. unimodalidade e não negatividade) e avaliado por um procedimento de validação. Os perfis resolvidos são do tipo porfirinico, pois apresentam bandas de excitação com máximos em 407, 416, e 431 nm, na região da banda Soret, característica deste tipo de composto. Os métodos propostos por Ledyard R. Tucker durante a década de sessenta apresentam o problema de rotação livre, tornando sua interpretação difícil de ser efetuada. Com a proposta de fazer a análise de dados em multi modos mais aceitável, este trabalho sugere uma metodologia para a extração de informações úteis do conjunto de dados. Para tal, a metodologia proposta se baseia na decomposição do conjunto de dados em blocos em 3 modos através de Modelos Tucker. Com o objetivo de capturar em um bloco a informação similar sobre as propriedades dos dados, a decomposição proposta emprega o Modelo Tucker Restrito, onde o núcleo possui alguns elementos com valores fixados em zero. Esta metodologia foi aplicada com sucesso em dados de propriedades físicas e físico-químicas de amidos extraídos de quatro cultivares de mandioca, colhidas em oito diferentes idades no período normalmente usado na colheita para fins industriais. Em geral, o método PARFAC emprega um espaço vetorial para descrever as matrizes resultantes da decomposição que promove. Este trabalho apresenta uma aplicação do PARAFAC onde os fatores resultantes da decomposição são considerados como sendo funções. Os objetos funcionais usados para ligar o PARAFAC e a análise funcional são as funções spline. Uma das vantagens do emprego de splines é a possibilidade de ativar a suavização dos perfis decompostos. A quantidade de suavização aplicada aos perfis é controlada, nesta metodologia, através de parâmetro de penalização, l, ou pelo número de funções de base. Desta forma, Spline-PARAFAC requer o cálculo do parâmetro l ou número de bases, que foram determinados através de uma validação cruzada ordinária. O Spline- PARFAC foi aplicado em um conjunto de dados formado por medidas horárias de monóxido de carbono durante os anos de 1997 e 1999 na cidade de São Paulo. O Spline-PARAFAC apresentou um bom desempenho descrevendo a maior variação diária de emissão deste gás e os efeitos sazonais ao longo do ano sobre esta variação.
Abstract: Two of the multi-way methods presented in this work were developed in psychometrics for psychological studies. On being applied in chemical data these methods demand on refinements to accommodate the variation present in the chemical data. Although the development of such kind of refinements there are some variation within the data which cannot be described by the multi-way methods. In this way, the main focus of the thesis is to describe the relationship between the parts of the data that can be described or not by the methods, in other words, how one can extract meaningful information from multi-way data set. Three topics are studied: Second order calibration; curve resolution and multi-way exploratory data analysis. In the second order calibration the influence of experimental behaviour over the multi-way structure of the data and how it affects the calibration results is evaluated. In the curve resolution, the variation of the data that cannot be accomodated by the methods, interfere on the choice of the number of curves to be resolved and a validadtion procedure is used on such choice. On the exploratory data analysis two problems are studied: In the first, it is suggested a methodology to discriminate the part of the data that can be described by the Multi Way methods from that one which cannot be described. In the second, a similar problem is treated where a smoothing method is used. With the current popularity of second-order (or hyphenated) instruments, there now exists a number of chemometric techniques for the so-called second-order calibration problem, i.e. that of quantifying an analyte of interest in the presence of one (or more) interferent(s). Second-order instruments produce data of varying complexity, one particular phenomenon sometimes encountered being that of rank overlap (or rank deficiency), where the overall rank of the data is not equal to the sum of the ranks of the contributing species. One of the purpose of the present work is to evaluate the performance of two second-order calibration methods, a least squares-based and an eigenvalue-based solution, in terms of their quantitative ability and stability, as applied to flow injection analysis (FIA) data which exhibits rank overlap. In the presence of high collinearity in the data, the least squares methods is found to give a more stable solution. Two-mode component analysis (TMCA) is used to investigate the reasons for this difference in terms of the chemical properties of the species analyzed. The success of the second-order calibration in general is found to depend strongly on the associated pKa values. Chromophores identification in biological samples often demands on the physical separation of the compounds, which can be difficult. Although there are several advantages of hyphenated spectroscopic techniques on substances identification, complex mixtures of chromophores presenting overlapped spectra cannot be identified directly. This work presents a chemometric application to compounds identification in biological samples by spectroscopic hyphenated techniques using a curve resolution method. The PARAllel FACtor analysis model (PARAFAC), which has no rotational indeterminacy, was used for curve resolution of excitation-emission spectra of human dental tartars. PARAFAC was applied under constraints (i.e unimodality and non-negativity) and evaluated with a validation procedure. The resolved profiles are porphyrinic like spectra presenting the excitation band maxima in 407, 416 and 431nm in the Soret band region (390-440nm) of these substances. The original methods proposed by Ledyard R. Tucker during the 1960s presented the rotational freedom problem, making the interpretation of results obtained by these methods rather difficult to be carried out. On the proposal of making the multi-way data analysis more acceptable, this work suggests a methodology for extracting meaningful information from the data set. For that, the proposed methodology is based on the decomposition of the data set in 3-way blocks by using Tucker Models. With the aim of keeping in one block the similar information about data properties, it is proposed decomposition based on a Constrained Tucker Model, where the core array has some of its elements fixed to zero. This methodology is successfully applied to a data set formed by physical and physico chemical properties of starches of four cassava cultivars, harvested at different ages during the period usually taken for harvest of industrial uses. The PARAFAC model has been used in several applications in chemistry, e.g. for overlapped spectra resolution, second order calibration and others. In general, the PARAFAC method uses a vector space approach by considering the resulting matrices from the decomposition as a collection of vectors. This work presents a PARAFAC application where the decomposition resulting factors are considered as being functions. The functional objects used to link PARAFAC method and functional analysis are spline functions. The methodology used to promote the Spline-PARAFAC decomposition is based on Bro-Sidiropoulos' approach for the unimodality constraint. One of the advantages of using splines is the possibility of achieving smoothing on the decomposed components. The amount of smoothing applied on the components is controlled in the presented methodology by a penalty parameter or by the number of basis functions. Thus Spline-PARFAC requires the calculation of the parameter l and the number basis, which were found in this work by using an Ordinary Cross Validation OCV. The Spline-PARAFAC was applied to a carbon monoxide data set, which corresponds to concentrations measured every hour during the years of 1997 and 1999 in the São Paulo city in Brazil. Each data set was arranged in a Three Way Array of dimension (24 hoursx5 daysx52 weeks). The Spline-PARAFAC presented a good performance producing smoothed profiles which describe the dally variation of emitted gas and the seasonal effects during the year.
Arquivo (Texto Completo): vtls000245749.pdf ( tamanho:909 KB )

Instituto de Química / Caixa Postal n° 6154
Universidade Estadual de Campinas - UNICAMP
13083 - 970, Campinas, SP, Brasil
e-mail: biq@iqm.unicamp.br
© 2012-2014 BIQ