54ª RBRAS e 13º SEAGRO

Sessões Temáticas

Serão dez sessões temáticas, com duas horas de duração, nas quais os palestrantes convidados apresentarão seus trabalhos, seguidos de uma discussão geral envolvendo participantes, organizadores e audiência.
Atividades



Sessão Temática 1
ENSAIOS CLÍNICOS
Coordenação: Cicília Yuko Wada - UNICAMP

Teatro Florestan Fernandes
 

CONCEITOS DE FARMACOCINÉTICA EM ESTUDOS DE GENÉRICOS

Odaly Toffoletto - USP

O crescimento da indústria de medicamento genérico, que levou à disponibilidade de diferentes fontes do mesmo medicamento, na mesma concentração, gera controvérsias entre os cientistas e os profissionais da saúde acerca da equivalência terapêutica desses produtos.
A biodisponibilidade de diferentes formulações contendo a mesma concentração de um dado fármaco representa um desafio no tratamento da saúde, sendo o entendimento desse assunto alta relevância para envolvidos.
Biodisponibilidade é um termo de farmacocinética que descreve a velocidade e a extensão que um determinado fármaco é absorvido e se encontra disponível no seu local de ação. Uma vez que nem sempre seja possível medir-se a concentração da droga no seu local de ação, a maioria dos estudos mede a concentração do fármaco no sangue ou na urina.
Dessa forma, é de extrema importância que os profissionais envolvidos na avaliação de produtos genéricos / similares (incluindo bioestatíscos) compreendam os princípios e os conceitos de biodisponibilidade e bioequivalência.
A aula pretende discutir os princípios básicos que envolvem a transferência de moléculas entre os diversos compartimentos do organismo, com foco na determinação da farmacocinética e nos desenhos de estudo para determinação de bioequivalência / biodisponibilidade relativa.

topo

 

FORMANDO PROFISSIONAIS DE BIOESTATÍSTICA NO BRASIL

Doris Satie Maruyama Fontes - CONRE 3

Pesquisas na área da saúde estão entre as mais importantes para a população. São pesquisas complexas envolvendo profissionais de diferentes áreas, desde médicos, farmacêuticos, químicos, passando por enfermeiros, psicólogos, administradores, advogados e, logicamente, estatísticos.
Desde os primeiros passos na elaboração de uma pesquisa clínica, quando definem-se as perguntas e traçam-se objetivos buscados, até a sua conclusão, a presença dos estatísticos tem ajudado a melhorar a qualidade do planejamento, da coleta de dados, das análises produzidas.
Nos últimos 10-15 anos verificou-se um aumento significativo na quantidade de pesquisas clínicas realizadas no Brasil. Dados da Anvisa mostram, por exemplo, que a CONEP avaliou em 2005 1253 projetos ante os 169 em 1997. É um aumento estrondoso em menos de 10 anos, mesmo considerando que havia ocorrido uma queda de quase 30% no número de projetos apresentados em 2004 para 2005.
Atualmente, o sítio da Anvisa traz uma lista de 26 Centros autorizados de Bioequivalência na área de Medicamentos. Destes, apenas 15 têm cadastrados junto à Anvisa um profissional designado como Estatístico Responsável. É um número pequeno para o tamanho da produção de pesquisas que há no Brasil.
Se considerarmos todas as pesquisas na área médica e de saúde pública, sejam elas ligadas a fármacos, cosméticos, alimentos, ou procedimentos clínicos, cirúrgicos ou fisioterápicos, pode-se imaginar a quantidade diária de planejamentos de experimentos, coleta de dados e análises estatísticas realizados todos os dias por instituições públicas ou privadas.
Com tantos projetos ligados à área médica, como andará a formação do estatístico, ou melhor, do bioestatístico, para trabalhar especificamente com este tipo de projeto, em geral inundado por um linguajar, terminologias e jargões tão próprios?

A formação do bioestatístico em países como os Estados Unidos vive uma realidade muito diferente da nossa. Em uma contagem rápida, contabilizamos pelo menos 43 programas de Doutorado ligados à Bioestatística/Biomatemática (27), Bioestatística/Epidemiologia (6), Ciências Biológicas/Investigações Clínicas (2),  Bioinformática/Biotecnologia (3) e Biometria/Saúde Pública/Epidemiologia (5). Em nível de mestrado há pelo menos 59 programas sendo 36 deles ligados diretamente à Bioestatística/Biomatemática. A grande maioria destes programas é oferecida pelos departamentos/institutos de Saúde Pública ou Medicina.
No Brasil, a bioestatística parece não chamar ainda a atenção das universidades e nem tem provocado interesse entre alunos da estatística. Oficialmente há pouquíssimos programas de pós strictu sensu de bioestatística ou biometria, ou mesmo epidemiologia e parece-nos relevante discutir mais concretamente o que é preciso fazer para aumentar a oferta de cursos e, ao mesmo tempo, atrair mais estudantes, sobretudo estatísticos, para seguir complementando seus estudos na área de bioestatística.

topo




 
Sessão Temática 2
ANÁLISE DE SOBREVIVÊNCIA APLICADA
Coordenação: Enrico Antonio Colosimo - UFMG

Anfiteatro Bento Prado Junior

Análise de sobrevivência é uma das áreas da estatística que mais cresceu nas últimas décadas. A razão deste crescimento é a demanda de técnicas especializadas por outras áreas do conhecimento combinado com a disponibilidade de computadores cada vez mais velozes. Em especial, aplicações em medicina são fontes de motivação para o desenvolvimento e aprimoramento de técnicas especializadas em análise de sobrevivência.
O objetivo desta sessão temática é trazer pesquisadores envolvidos em aplicações reais na área médica. Três áreas da medicina estão contempladas nesta sessão, pesquisa clínica, epidemiologia e genética humana. Três pesquisadores que trabalham ativamente e fazem pesquisa nestas áreas foram convidados para compor esta sessão. Eles irão trazer para o evento aplicações atuais nestas áreas cujos resumos estão apresentados a seguir.

 

ANÁLISE DE SOBREVIVÊNCIA EM EPIDEMIOLOGIA

Aluisio Jardim Doenellas de Barros - UFPel

Estudos transversais envolvendo respostas binárias ocorrem com frequência na literatura epidemiológica. Respostas deste tipo são usualmente tratadas através do modelo de regressão logística. A razão de chances (odds ratio) é a medida de associação obtida após a utilização de tal modelo. No entanto, a razão de chances pode superestimar a razão de prevalência, que é a medida de preferência em tais estudos. Além deste fato, o controle por confundimento não é equivalente para estas duas medidas. Neste trabalho, vamos explorar modelos alternativos para estes estudos envolvendo técnicas que estimam diretamente a razão de prevalência. Dados epidemiológicos brasileiros ilustram a aplicação destas técnicas.

topo

 

ANÁLISE DE SOBREVIVÊNCIA EM PESQUISAS MÉDICAS

Ângela Tavares Paes - UNIFESP/Instituto Albert Einstein

Métodos relacionados à Análise de Sobrevivência têm se tornado cada vez mais populares em pesquisas da área médica. Praticamente todos os estudos com interesse em estudar a evolução de pacientes depois de determinado tratamento ou intervenção envolvem curvas com estimativas de probabilidade livre de eventos e modelos que visam identificar fatores preditores de melhor ou pior prognóstico. Embora métodos mais usuais como curvas de Kaplan-Meier e Regressão de Cox expliquem satisfatoriamente muitas questões ou hipóteses clínicas, é comum encontrar problemas com algumas particularidades que limitam a aplicação de métodos mais simples. A ideia desta apresentação é mostrar alguns exemplos de pesquisas médicas em que foi necessário utilizar variações do modelo de Cox que levassem em conta certas características dos dados, tais como dependência das observações, interações entre variáveis, proporções de pacientes curados e efeitos de covariáveis variando no tempo. Com ênfase na aplicabilidade dos métodos em detrimento ao formalismo teórico, o objetivo é mostrar a variedade de aplicações de diferentes metodologias de análise em conjuntos de dados reais.

topo

 

ANÁLISE DE SOBREVIVÊNCIA EM GENÉTICA HUMANA

Suely Ruiz Giolo - UFPR

Diversas doenças genéticas complexas, como o câncer de mama, hipertensão e diabetes, apresentam uma variação na idade de sua ocorrência, o que certamente desperta o interesse em avaliar se tal variabilidade estaria sendo influenciada por fatores genéticos e/ou ambientais compartilhados. Estudos com famílias, isto é, aqueles em que a coleta de dados é feita em indivíduos e em seus familiares, têm se mostrado úteis para essa finalidade. Como os modelos de componentes de variância clássicos não se mostram apropriados para a análise da idade de ocorrência dessas doenças, em particular pela presença de censuras, apresentaremos a aplicação de um modelo de riscos proporcionais de efeitos mistos que combina a flexibilidade da análise genética via o modelo de componentes de variância e o modelo de riscos proporcionais de Cox. Dados de famílias serão utilizados com o objetivo de avaliar a influência de fatores genéticos e ambientais na idade de ocorrência/diagnóstico de algumas doenças complexas.

topo




 
Sessão Temática 3
ESTATÍSTICA ESPACIAL
Coordenação: Alexandra Mello Schmidt - UFRJ

Anfiteatro Bento Prado Junior
 

MODELANDO A DENSIDADE DE OVOS DO MOSQUITO AEDES AEGYPTI USANDO COVARIÁVEIS AMBIENTAIS E CLIMÁTICAS

Aline Araújo Nobre - FIOCRUZ

O registro de casos de dengue nos últimos anos, no Brasil, caracteriza a repetição anual de ocorrência de surtos epidêmicos. As dificuldades que estão sendo enfrentadas para impedir a intensificação da transmissão apontam a necessidade de mais conhecimentos para compreender, com bases científicas, as situações ambientais e biológicas que precedem os surtos, particularmente nos ambientes urbanos. A incidência média de dengue por 100.000 habitantes no Rio de Janeiro é de 27 em anos não epidêmicos e 470 em anos epidêmicos. O vírus Dengue é transmitido por mosquitos do gênero Aedes, sendo o principal deles, o Aedes aegypti. Os dados deste trabalho são provenientes do projeto SAUDAVEL (Sistema de Apoio Unificado para Detecção e Acompanhamento em Vigilância Epidemiológica) que desenvolve novas técnicas em tecnologia de informação espacial para a vigilãncia e controle de doenças.Os dados consistem da contagem de ovos do mosquito coletados em armadilhas de oviposição para Aedes (ovitrampas) colocadas em 5 áreas de Recife definidas segundo parâmetros sócio-ambientais. Em cada área foram instaladas e georeferenciadas entre 80 a 100 ovitrampas, totalizando 465 ovitrampas em toda região de estudo. Um sistema de rodízio mensal permitiu a contagem semanal de ovos em ¼ das armadilhas de cada área durante 2 anos. Além disso, temos informações sobre variáveis climáticas e características das casas onde foram colocadas as ovitrampas. A anáĺise foi dividida em duas partes. Primeiro, realizamos uma análise temporal para cada área, investigando a influência da chuva. Para isso, comparamos o modelo de poisson tradicional com a distribuição binomial negativa, para tratar a superdispersão presente nos dados. Em seguida, consideramos o tempo fixo, e analisamos a distribuição espacial considerando as características das casas. Utilizamos um modelo de poisson com efeitos aleatórios espaciais utilizando distribuições a priori adequadas. Os modelos foram comparados usando o critério de Informação da Deviance (DIC).

topo

 

MODELOS DINÂMICOS BAYESIANOS PARA PROCESSOS PONTUAIS ESPAÇO-TEMPORAIS

Edna Afonso Reis - UFMG

O estudo de processos pontuais observados no espaço e no tempo tem se tornado uma importante área da Estatística Espacial. Neste trabalho, é proposto um modelo espaço-temporal especificado por uma seqüência de superfícies de intensidades espaciais ligadas no tempo através de modelos dinâmicos, resultando nos denominados processos pontuais espaciais dinâmicos. A inferência para esses processos é feita sob a abordagem bayesiana, com utilização de métodos MCMC, como o amostrador de Gibbs e o algoritmo de Metropolis-Hastings. Os modelos e métodos de estimação propostos foram intensivamente testados em estudos simulados e aplicados em um conjunto de dados experimentais de impulsos elétricos no intestino delgado de gatos e em um conjunto de dados observacionais dos casos de doenças gastrointestinais no condado de Hampshire, no Reino Unido.

topo

 

SPATIALLY HIERARCHICAL FACTOR MODELS: BUILDING A VULNERABILITY INDEX TO DENGUE FEVER IN URUGUAY

Hedibert Freitas Lopes - University of Chicago

We introduce a spatially hierarchical factor model, or a vulnerability index, to measure dengue fever in Uruguay. Our proposal combines spatial information among different municipalities across the region (large scale information) with census tracts information at the municipality level (small scale information). Aedes aegypti, the main dengue fever transmitting vector, was reintroduced in Uruguay in 1997 with no cases of the disease been registered up to this point in time. It is of great importance to point the regions of the country which are vulnerable to the reintroduction of the disease. It is common to observe, in social studies, social indices built based on sets of indicators observed on census tract level of municipalities across the countries. In our sample the number of census tracts vary significantly, ranging from as low as 16 (Bella Union) up to 1012 (Montevideo) tracts. A simple comparison with a benchmark procedure, one which aggregates observations at the municipal level before building the index, suggests that our vulnerability index is more sensitive to local characteristics and, therefore, more capable of capturing subtle differences across regions of the country. Our factor model entertains point referenced data at the country level and areal data within municipalities. We expect that within a municipality, census tracts which are close together, tend to have similar values of the variables, and behaving on a more independently fashion if the tracts are far apart. On the other hand, in the country level, one expects that index values vary smoothly across the municipalities. More specifically, we combine the information available on p variables measured at n_i, (i=1,...,n) census tracts across n municipalities. The municipality size (number of tracts) is taken into account and provide a tool of weighing the contribution of a variable (according to its location) to the overall vulnerability index. Moreover, different from standard procedures, independence across locations is not imposed.

topo




 
Sessão Temática 4
MÉTODOS ESTATÍSTICOS EM GENÉTICA
Coordenação: Luís Aparecido Milan - UFSCar

Anfiteatro Bento Prado Junior
 

TESTES DE HOMOGENEIDADE EM SEQUÊNCIAS GENÔMICAS E DADOS DE MICROSATÉLITES

Hildete Prisco Pinheiro - UNICAMP

Consideramos testes de homogeneidade entre grupos através de comparações de sequências de DNA e também de dados de microsatélites. Os testes são adaptações da decomposição da Análise de Variância clássica, utilizando-se medidas de diversidade como a distância de Hamming, sem necessariamente usar os segundos momentos. Nesse método, o teste de hipótese tem alternativa unicaudal e utiliza-se da teoria de U-estatísticas para obtenção das distribuições assintóticas das estatísticas de teste. São apresentadas aplicações a dados de sequências de DNA de primatas e a dados de microsatélites de indivíduos classificados de acordo com etnia e índice de alcoolismo. Os p-valores para os testes são obtidos através de métodos de reamostragem como bootstrap e jackknife.

topo

 

DAS VARIAÇÕES GENÔMICAS ÀS DOENÇAS: OS DESAFIOS DA ANÁLISE DE “CHIPS”

Júlia Maria Pavan Soler - IME/USP

Relacionar variações genômicas com variações fenotípicas tem sido alvo de muitas pesquisas em Genética. Neste sentido, nos últimos anos, os avanços alcançados por esta área do conhecimento foram inestimáveis no que tange às diferentes possibilidades de coleta de dados do genoma, bem como do transcriptoma e do proteoma. Estamos na era dos “chips” de informação, que permitem a coleta simultânea de milhares de dados moleculares de um indivíduo. Este estado da arte impõe, por sua vez, muitos desafios analíticos. Nesta palestra trataremos de problemas como: processamento e análise de dados de SNPs e CNVs (que consistem de algoritmos robustos de agrupamento, correções para o efeito de estrutura de população, combinação de locos e identificação de pontos de mudança no genoma para ganhos e perdas de regiões) e integração de bancos de dados de diferentes plataformas. Além disso, traremos à discussão dilemas do planejamento de experimentos em Genômica.

 

GENÉTICA ESTATÍSTICA EM UMA COMPANHIA DE MELHORAMENTO MULTINACIONAL

Heyder Diniz Silva – MONSANTO

 

topo




 
Sessão Temática 5 / EMBRAPA
ESTATÍSTICA APLICADA EM BIOLOGIA MOLECULAR
Coordenação: Luciana Correia de Almeida Regitano - EMBRAPA/Pecuária-SUDESTE

Anfiteatro 1

A genômica tem realizado grandes avanços metodológicos nos últimos anos, com o desenvolvimento de metodologias e equipamentos capazes de produzir volume significativo de informações simultâneas sobre o genoma estrutural e funcional. A correta utilização dessa informação requer o desenvolvimento simultâneo de metodologias estatísticas adequadas. Um dos problemas freqüentes no tratamento estatístico desses dados é a multiplicidade de testes, requerendo procedimentos que permitam controlar a elevada taxa de falsos positivos, além da incorporação de pressuposições genéticas nos modelos de análise. Na presente seção serão abordadas as metodologias estatísticas aplicadas ao mapeamento de locos de características quantitativas (Quantitative trait loci - QTL) e à análise de expressão gênica em larga escala.


MODELOS PARA MAPEAMENTO DE QTLS E ESTUDO DA BASE GENÉTICA DA HETEROSE

Antonio Augusto Franco Garcia - ESALQ/USP

Apesar da importância do fenômeno da heterose para a Genética e o Melhoramento Genético, sua base genética ainda não foi completamente desvendada. São três as principais hipóteses usadas para explicar seu surgimento: dominância, sobredominância e epistasia. O Delineamento III é um delineamento genético proposto com a finalidade de fornecer estimativas do grau médio de dominância dos caracteres quantitativos, e dessa forma tem sido usado para estudar a base genética da heterose. Com o surgimento dos marcadores moleculares, é possível usá-lo para estudar a ação gênica de cada QTL individualmente, fornecendo maiores evidências sobre o tipo de ação gênica envolvida. Contudo, os métodos genético-estatísticos desenvolvidos até o momento não usam de forma adequada toda a informação disponível, podendo inclusive levar a interpretações errôneas do fenômeno. Na palestra, será apresentada uma expansão da análise estatístico-genética do Delineamento III com marcadores moleculares para um novo contexto, envolvendo modelos para Mapeamento de Múltiplos Intervalos (MIM). Esse novo modelo MIM para o Delineamento III permite melhores estimativas do número, posição, efeitos e interações entre os QTL´s. Em seguida, serão apresentados dois exemplos de análise, usando milho e arroz.

topo


MÉTODOS PARA ANÁLISE DE MICRO-ARRANJOS DE OLIGONUCLEOTÍDEOS EM ESTUDOS DE EXPRESSÃO GÊNICA

Fernando Flores Cardoso - Embrapa/Pecuária-Sul

Os experimentos de expressão gênica em microarranjos de DNA são uma alternativa para identificar, em larga escala, genes que contribuam para a variação em fenótipos de interesse econômico ou biomédico. Nesses experimentos, o efeito de um tratamento, condição ou mesmo de um genótipo, sobre a expressão gênica (abundância de transcrição) é mensurado para milhares de genes simultaneamente, facilitando a identificação de redes de regulação gênica e rotas metabólicas. Genes diferencialmente expressos são candidatos naturais para explicar a variação observada devido a determinada condição ou resposta a tratamento. O objetivo deste trabalho é apresentar métodos e ferramentas de análise estatística para prospecção de genes diferencialmente expressos em microarranjos de alta densidade de oligonucleotídeos. Nesses microarranjos cada gene é representado com uma série de 11 a 20 sondas de 25 bases de comprimento e para cada sonda há um autocontrole gerado pela troca de base na posição média da sonda, sendo que sonda e autocontrole são sintetizados lado a lado na lâmina por fotolitografia. A expressão é medida por meio da hibridação das sondas com amostras marcadas com corante fluorescente e avaliando-se a intensidade luminosa, uma amostra em cada lâmina. Nas análises estatísticas desses experimentos, é adotado um procedimento em dois passos, o primeiro de normalização global e o segundo para testar a interação entre tratamento e a expressão de um determinado gene. A normalização é realizada utilizando-se informações de intensidade do par sonda e autocontrole, através de uma transformação logarítmica para diminuir a dependência entre média e variância e uma normalização de quantil global para cada lâmina. Posteriormente, as informações dos conjuntos de sondas para cada gene são sumarizadas em um único valor, empregando-se um modelo que considera o nível de expressão global na lâmina e a afinidade de cada sonda. Para testar a interação gene por tratamento, o modelo básico para análise dos dados é de parcela dividida, com o seguinte formato: Yijkl = μ + Ti + Aj(i) + Gk + TGik + εijk, onde Y é o valor normalizado da intensidade; A, T e G representam os efeitos principais de arranjo, tratamento e gene; e TG é o efeito de interação entre gene e tratamento; assumindo E(Aj(i)) = 0 e Var(Aj(i)) = σ²A; εijk é o erro aleatório, E(εijk) = 0 e Var(εjk) = σ²ε(k), ou seja, com variâncias do erro heterogêneas para cada gene. Neste modelo, o efeito TG é o de principal interesse nos experimentos de expressão, pois relaciona o tratamento com a expressão dos genes. A multiplicidade de testes é considerada por meio de um procedimento para controlar a taxa de descobertas falsas (FDR), isto é, a proporção de genes significantes que são na realidade falsas descobertas. Finalmente, para identificar grupos de genes com o mesmo padrão de expressão diferencial, é utilizada de análise de grupamento ou clusterização. A aplicação do procedimento é ilustrada usando-se pacotes desenvolvidos pelo projeto Bioconductor dentro do Programa R, usando-se dados de bovinos.

topo




 
Sessão Temática 6
ECONOMETRIA
Coordenação: Gauss Moutinho Cordeiro - UFRPE

Anfiteatro 1
 

COMPUTATIONAL TOOLS FOR COMPARING ASYMMETRIC GARCH MODELS VIA BAYES FACTORS

Ricardo Sandes Ehlers - ICMC/USP

In this paper we use Markov chain Monte Carlo (MCMC) methods in order to estimate and compare GARCH models from a Bayesian perspective. We allow for possibly heavy tailed and asymmetric distributions in the error term. We use a general method proposed in the literature to introduce skewness into a continuous unimodal and symmetric distribution. For each model we compute an approximation to the marginal likelihood, based on the MCMC output. From these approximations we compute Bayes Factors and posterior model probabilities.

topo

 

MODELO DE REGRESSÃO LINEAR COM ERROS SLASH-ELÍPTICO

Francisco José de Azevedo Cysneiros - UFPE

As distribuições de probabilidade geralmente utilizadas para modelagem de dados quando há simetria no comportamento dos erros do modelo são as pertencentes a família elíptica, sendo a distribuição normal a mais utilizada na literatura dentre todas as distribuições elípticas. Neste trabalho abordaremos uma outra classe de distribuições que apresenta a propriedade de simetria proposta recentemente por Gómez, Quintana e Torres (2007), denominada de distribuição slash-elíptica. A distribuição slash-elíptica apresenta como principal característica uma maior flexibilidade quanto ao grau da curtose frente a distribuição elíptica, além de conter a família elíptica como um caso limite. Propomos uma metodologia de estimação, testes de hipóteses, análise de resíduos e diagnóstico para a classe de modelos lineares com erros slash-elípticos com parâmetro q conhecido. Para ilustrar nossa metodologia uma aplicação na área de econometria será apresentado.
Palavras chave: Influência, Distribuição Slash-Elíptico, Observações extremas. Endereço para correspondência: Francisco José A. Cysneiros, Departamento de Estatística, Universidade Federal de Pernambuco, CEP 50740-540. e-mail: cysneiros@de.ufpe.br

topo




 
Sessão Temática 7 / EMBRAPA
ESTATÍSTICA E MEIO AMBIENTE
Coordenação: Alfredo José Barreto Luiz - EMBRAPA/Meio Ambiente

Anfiteatro 1
 

MÉTODOS ESTATíSTICOS MULTIVARIADOS EM ANÁLISE AMBIENTAL

Paulo Milton Barbosa Landim - UNESP/Rio Claro

Nas últimas décadas, graças a avanços tecnológicos tanto em termos computacionais como em equipamentos de laboratório e de campo mais refinados, tem sido intensa a obtenção de dados referentes ao meio ambiente. A sua análise, porém, está muito aquém dessa imensa quantidade de informações coletadas. Basta ver os relatórios de pesquisa e mesmo os bancos de dados com um grande número de matrizes de informações não trabalhadas. Verbas e tempo são gastos com essa coleta que precisa ser devidamente manuseada e para essa análise dos dados o emprego de técnicas estatísticas multidimensionais torna-se uma ferramenta fundamental. Isto porque, como os fenômenos naturais são resultantes de diversos fatores condicionantes, o seu entendimento é facilitado quando o estudo é submetido a um enfoque quantitativo multidimensional. Deve ser enfatizado, porém, que a pura utilização de técnicas estatísticas, hoje em dia bastante facilitada graças à vasta disponibilidade de programas computacionais, não é condição suficiente se o estudo não for embasado num sólido conhecimento específico sobre o assunto.
Situações que apresentam dados multivariados são comuns como, por exemplo: análises geoquímicas de elementos maiores ou elementos traços; índices morfométricos de drenagens; distribuição granulométrica, porosidade, permeabilidade de solos; variáveis fluviais, como descarga, material em suspensão, profundidade, sólidos dissolvidos, pH e conteúdo em oxigênio etc.
Entre os métodos mais utilizados da estatística multivariada podem ser citados a análise de agrupamentos, a análise de componentes principais, a análise de correspondências e a análise discriminante.
A análise de agrupamentos é utilizada quando se deseja explorar as similaridades entre indivíduos ou entre variáveis definindo-os em grupos, considerando simultaneamente, no primeiro caso, todas as variáveis observadas em cada indivíduo e, no segundo, todos os indivíduos nos quais foram feitas as mesmas medidas. Segundo esse método, procura-se por 2 agrupamentos homogêneos de itens representados por pontos num espaço ndimensional em um número conveniente de grupos relacionando-os através de coeficientes de similaridade ou de distância.
A análise de componentes principais procura interpretar a estrutura de um conjunto de dados multivariados a partir da respectiva matriz de variânciascovariâncias ou de correlações, pela obtenção de “autovalores” e “autovetores”. Consiste numa transformação linear das "m" variáveis originais correlacionadas entre si em "m" novas variáveis ortogonais. Esta análise transforma as variáveis originais de tal modo a descrever a mesma variabilidade total existente, porém não mais correlacionadas entre si. Graficamente pode ser descrita como a rotação de pontos existentes num espaço multidimensional originando eixos, ou componentes principais, que dispostos num espaço, as duas dimensões representem variabilidade suficiente que possa indicar algum padrão a ser interpretado.
A análise de correspondências usa dados discretos para verificar simultaneamente as associações entre variáveis e espécimes. Neste caso os dados são agrupados em tabelas de contingências. Nessas tabelas os valores originais são transformados de modo a poder ser interpretados como probabilidades condicionais. Por causa da natureza dessa transformação as relações entre colunas e linhas da tabela transformada são as mesmas que aquelas da matriz original da dados. Isso significa que as soluções são equivalentes e, desse modo, o produto final mostra num espaço bidimensional, definido pelos dois mais importantes autovetores, a distribuição simultânea tanto das amostras como das variáveis.
A análise discriminante é aplicada quando se quer verificar se dois ou mais grupos, em que foram medidas as mesmas variáveis, podem ser considerados iguais ou não. Tal processo exige, portanto, um conhecimento "a priori" das relações existentes entre os grupos estudados e a idéia básica é substituir o conjunto original das diversas mensurações por um único valor Di, definido por funções discriminantes lineares. Geralmente, escolhem-se as duas funções discriminantes de maior peso para servir como eixos ortogonais para uma distribuição das observações dos diversos grupos e os respectivos centróides.

topo

 

ESTATÍSTICAS AMBIENTAIS NO BRASIL E NA AMÉRICA LATINA

Wadih João Scandar Neto - IBGE

A organização, sistematização, e produção continuada de estatísticas ambientais por instituições oficiais de estatística atende, em primeiro lugar, o interesse, o direito e a necessidade de saber e se informar do público geral e, em conseqüência, ao debate e à condução de ações políticas associadas ao tema. Evidentemente, essas estatísticas servem, especificamente, às atividades de planejamento e acompanhamento público e privado das próprias instituições envolvidas com os temas ambientais. Sua produção constitui atividade especializada que pressupõe a articulação de diferentes fontes e informantes.
O termo Estatística Ambiental abrange uma ampla e heterogênea coleção de estatísticas. Uma boa parte delas é composta por conjuntos de informações que expressam estoques ou fluxos de recursos naturais ou energia, permitindo a caracterização ambiental de uma região. Outra importante vertente é composta pelas informações relativas à "qualidade" de um recurso natural, compreendida como a adequabilidade do recurso para uso e consumo pelo homem, ou pelas atividades por ele realizadas. Neste caso, enquadra-se a maioria das estatísticas que tratam da poluição. Também associado ao conceito de qualidade ambiental estão as estatísticas que mensuram a sensação de bem estar e de conforto ambiental das populações humanas, como no caso das poluições sonora e visual.
Assim, as estatísticas ambientais podem ser entendidas como uma forma de medir a disponibilidade e a qualidade dos recursos naturais (água, solo, ar, vegetação/biomassa, etc.) e da energia presentes num local, e a sua adequabilidade às necessidades e ao conforto das populações humanas.
Internacionalmente o termo “estatísticas ambientais” geralmente é utilizado em sentido amplo congregando as estatísticas básicas propriamente ditas, indicadores ambientais e contas econômico-ambientais integradas.
A apresentação tem por objetivo difundir estes conceitos entre usuários e produtores de informações ambientais, classificando as principais formas de obtenção de informações desta natureza, relatando brevemente as principais recomendações internacionais sobre o tema e fazendo uma exposição do estágio atual de desenvolvimento das estatísticas ambientais oficiais no Brasil e em alguns países da América Latina.
Pretende-se também, ao final, estabelecer algumas conexões sobre a forma como a modelagem estatística pode contribuir para o aprimoramento desta produção.

topo




Sessão Temática 8 / ABE
SESSÃO ABE
Coordenação: Hildete Prisco Pinheiro - UNICAMP

Anfiteatro 1
 

UM MODELO COM EFEITOS MISTOS PARA DADOS DE POISSON COM O ZERO INFLACIONADO E COM SUPERDISPERSÃO: UMA APLICAÇÃO EM MELHORAMENTO ANIMAL

Mariana Rodrigues Motta - UNICAMP

Variáveis respostas classificadas como contagem, como por exemplo, número de casos de mastite em vacas leiteiras, estão presentes na análise de dados genéticos quantitativos. Quando o número de zeros excede a quantidade esperada sob a distribuição de Poisson, um modelo de Poisson com o zero inflacionado (ZIP) é mais apropriado. Quando aplicado no estudo de melhoramento animal, é necessário que o modelo ZIP acomode covariâncias genética e ambiental. Neste estudo, propomos modelar os parâmetros de mistura e da distribuição de Poisson hierarquicamente, cada um em função de dois efeitos aleatórios, representando fontes de variabilidade genética e ambiental, respectivamente. Os efeitos aleatórios genéticos são correlacionados, resultando numa correlação dentro e entre grupos. Os efeitos aleatórios ambientais são representados por resíduos independentes, e acomodam superdispersão alem daquela causada por excesso de zeros. Adicionalmente, uma estrutura de correlação entre os efeitos genéticos afetando os parâmetros de mistura e da distribuição de Poisson é usada para inferir pleitropia, uma expressão do quanto genes comuns influenciam estes parâmetros. Os métodos descritos aqui são ilustrados com dados sobre o número de casos de mastite em vacas leiteiras noruegueses. Uma análise Bayesiana é usada para produzir distribuições a posteriore, através das quais estudamos variabilidade genética e ambiental, bem como correlação genética.

topo

 

MODELOS DE REGRESSÃO PARA DADOS DE SOBREVIVÊNCIA BASEADOS EM PSEUDO-VALORES COM APLICAÇÃO A ESTUDOS DE TRANSPLANTE DE MEDULA ÓSSEA

Gisela Tunes da Silva - IME/USP
John P. Klein

Usualmente, dados de tempo até ocorrência de um evento (análise de sobrevivência) são analisados por meio de modelos de regressão para a função de taxa de falha. No entanto, em muitas situações, tais como riscos competitivos ou modelos multiestados, deseja-se verificar a influência de covariáveis na probabilidade de pacientes estarem em determinado estado de saúde após algum tempo. As probabilidades de ocupação de estados são funções não lineares complexas das funções de taxa de falha associadas às transições do processo considerado e, portanto, modelos de regressão para funções de taxa de falha tornam-se difíceis de serem utilizados. Uma alternativa para essas situações é a utilização da técnica de pseudo-valores, que consiste em calcular quantidades apropriadas (denominadas pseudo-valores) com base no jackknife e utilizá-las como variável resposta em um modelo linear generalizado ou equações de estimação generalizadas. Neste trabalho, a técnica dos pseudo-valores é abordada com detalhes e considera-se a aplicação da técnica a dados provenientes de estudo de transplante de medula óssea.

topo




Sessão Temática 9 / EMBRAPA
APLICAÇÃO ESTATÍSTICA
Coordenação: Alfredo Ribeiro de Freitas e Waldomiro Barioni Júnior - EMBRAPA/Pecuária-SUDESTE

Teatro Florestan Fernandes
 

ANÁLISE QUANTITATIVA DA CONCENTRAÇÃO NA PRODUÇÃO AGRÍCOLA BRASILEIRA

Alfredo José Barreto Luiz - Embrapa/Meio Ambiente

Algumas mudanças no cenário agrícola, no Brasil como no mundo, ocorrem de maneira rápida e significativa. Assim, para manter os tomadores de decisão informados sobre a situação atual da distribuição do “negócio agrícola”, tanto em termos espaciais como entre produtos, é necessário um esforço constante de coleta, tratamento, checagem e análise das estatísticas agrícolas nacionais. O Instituto Brasileiro de Geografia e Estatística (IBGE) faz a coleta, checagem e publicação dos dados sobre a produção municipal de 62 espécies vegetais, sobre as quais são oferecidas, em base anual, informações sobre cinco variáveis: área plantada, área colhida, produção, rendimento e valor da produção. Há um enorme espaço para a análise quantitativa desses dados, que ainda não foi completamente ocupado pelos nossos técnicos e pesquisadores que militam nessa área limítrofe entre as estatísticas e as ciências agrárias. Eles estão a espera de quem os decifre. Nesse trabalho, ao se fazer uma análise relativamente simples sobre a variável “valor da produção”, calculando o índice de Gini como medida de concentração, chegou-se a algumas conclusões que parecem conter informação com potencial utilidade para os setores ligados ao negócio agrícola nacional. Uma primeira conclusão é que a nossa agricultura é extremamente concentrada, quanto ao valor da produção, em um pequeno número de produtos. O Índice de Gini calculado para essa variável sobre as 62 espécies levantadas pela pesquisa denominada Produção Agrícola Municipal (PAM) do IBGE, foi de 0,786 em 2005; 0,782 em 2006; e 0,795 em 2007, para todo o Brasil. Apenas os três produtos de maior valor da produção - soja, milho e cana-de-açúcar - somados, foram responsáveis, nestes três anos, de 2005, 2006 e 2007, por 46, 47 e 52%, respectivamente do valor total da produção dos principais produtos agrícolas brasileiros. Ressalte-se que os valores da produção pecuária, da extração vegetal e dos produtos da horticultura, não foram aqui considerados. Também foram efetuadas análises levando-se em conta a distribuição e a concentração da produção dos 5.545 municípios nos quais o IBGE realiza o levantamento de dados para a PAM. Essa concentração pode ser vista como uma fragilidade do nosso setor agrícola, pois um ataque especulativo em algumas dessas mercadorias que são negociadas em bolsa (commodities) ou uma significativa quebra da produção, causada por pragas, doenças ou eventos climáticos, pode vir a ter um efeito negativo importante nas finanças nacionais.

topo

 

MODELOS MATEMÁTICOS PARA ESTIMAÇÃO E PARA PROJEÇÃO DA EMISSÃO DE GASES DE EFEITO ESTUFA PELA PECUÁRIA

Luís Gustavo Barioni - Embrapa/Cerrados

Bovinos emitem de gases de efeito estufa, principalmente o metano (CH4) proveniente da fermentação dos alimentos no rúmen, embora óxido nitroso (N2O) e CH4 também sejam produzidos a partir da urina e fezes. As taxas de emissão de metano e óxido nitroso por um animal são basicamente função da quantidade e da composição dos alimentos ingeridos da dieta e da quantidade de alimento ingerida. Em geral, quanto mais fibroso o alimento (para um determinado nível de ingestão), maior a quantidade de CH4 emitida e quanto maiores os teores de proteína (e maior a excreção de nitrogênio), maiores as emissões de óxido nitroso. Considerando-se constantes o animal e a composição da dieta, quanto mais elevada a taxa de ingestão de alimentos mais elevadas as taxas de emissão de CH4 e N2O. Entretanto, o aumento da ingestão repercute em um aumento do desempenho animal proporcionalmente maior do que aquele das emissões gerando consistente redução nas emissões por unidade de produto. Em um rebanho as emissões por unidade de produto também dependem da eficiência reprodutiva, da mortalidade e das taxas de crescimento dos animais, demandando uma abordagem sistêmica na sua avaliação. Diversos modelos têm sido propostos para estimar as emissões de gases de efeito estufa por bovinos. Esses modelos têm sido utilizados com diversos propósitos. Um dos principais tem sido a elaboração de inventários nacionais de emissões, que informam estimativas das emissões de gases de efeito estufa para cada país. Outras importantes aplicações têm sido o estudo de estratégias de mitigação, tais como modificações na dieta e no desempenho produtivo e reprodutivo, e a projeção de taxas de emissão no futuro. Dependendo dos dados disponíveis, da aplicação e do objetivo, diferentes tipos de modelos têm sido aplicados. Tais modelos variam desde equações de regressão, ajustada com dados empíricos coletados por meio de diferentes técnicas, até modelos dinâmicos que simulam os principais processos bioquímicos do rúmen. Também, modelos de dinâmica do rebanho e simuladores do sistema produtivo têm sido aplicados em diversos estudos. Será apresentado um modelo para estimativa e projeção da emissão de gases de efeito estufa para o Brasil em diferentes cenários, e uma análise econômica das alternativas de mitigação em termos de sistemas produtivos. Nessa análise diferentes sistemas produtivos foram prototipados, sendo a produtividade do sistema, sua emissão de CH4 e N2O e seu retorno econômico avaliados. Além disso, o modelo simula cenários a nível nacional a partir da composição dos sistemas produtivos, a qual é calculada em função de projeções exógenas do efetivo do rebanho nacional, da área de pastagens no país e da demanda por carne bovina. O modelo possui grande potencial de aplicação em estudos para avaliação de estratégias de mitigação em nível nacional, incluindo recuperação de pastagens e adoção de sistemas mais intensivos de produção, tais como integração lavoura-pecuária e confinamento.

topo




Sessão Temática 10 / ESALQ
SESSÃO ESALQ
Coordenação: Roseli Aparecida Leandro - ESALQ/USP

Anfiteatro 1
 

PÓS-GRADUAÇÃO ESALQ/USP: 40 ANOS DE CONTRIBUIÇÃO PARA A PESQUISA BRASILEIRA

Clarice Garcia Borges Demétrio - ESALQ/USP

O Curso de Pós-Graduação (CPG) em Experimentação e Estatística, em nível de mestrado, teve início em 15 de setembro de 1964, com seis alunos. Com o êxito do mestrado, foi implantado o doutorado em 1979, passando o curso a denominar-se Estatística e Experimentação Agronômica. Até o presente momento foram defendidas 227 dissertações de Mestrado e 92 teses de Doutorado. O curso atende, prioritariamente, a instituições universitárias e de pesquisa do País e a América Latina e tem por objetivo a formação de profissionais com sólida base em Estatística, que possam atuar na pesquisa, na docência e no atendimento à comunidade, desenvolvendo atividades de: a) consultoria e assessoria estatísticas a empresas públicas e privadas e b) lecionamento de disciplinas relacionadas à experimentação agronômica, em níveis de graduação e pós-graduação. Mostraremos como foi a evolução desse programa, origem dos alunos e principais resultados obtidos.

topo


A IMPORTÂNCIA DA ESALQ/USP PARA A REGIÃO BRASILEIRA DA SOCIEDADE INTERNACIONAL DE BIOMETRIA

Euclides Braga Malheiros - UNESP/Jaboticabal

Falará da grande importância da ESALQ/USP para a Região Brasileira da Sociedade Internacional de Biometria - RBras. Hoje é a sede dessa Região, tem uma participação efetiva na organizando Eventos, tendo representantes na sua Diretoria, convidando membros da Sociedade Internacional para abrilhantar nossos eventos - trazendo conhecimentos aos participantes da RBras. Destacam-se as efetivas contribuições dadas pelo seu Programa de Pós-Graduação em Estatística e Experimentação Agronômica que tem formado profissionais brilhantes na área da Biometria, espalhados em todo o país. Sabe-se que este programa recebe alunos com diferentes formações (matemáticos, estatísticos, agrônomos, biólogos, médicos veterinários etc.), e tem potencial para atender essa diversidade de interessados, o que faz com que seus profissionais atuem nas diversas áreas da Biometria.

topo




Atualizado em: 18/07/2009.


Ferramentas Pessoais