Home
MINERAÇÃO E MODELAGEM DE CONCEITOS COMO PRAXIS DE
Contents
1. O modelo de Porter comentado por Fuld 2007 como um ecossistema baseado na an lise de contexto competitivo Esse autor assim define a import ncia da an lise de contexto O contexto tudo em um jogo o meio pelo qual voc analisa a intelig ncia e o mpeto estrat gico de seus advers rios O contexto que consideramos ideal para um jogo de guerra s o as cinco for as e o modelo dos quatro componentes da an lise da concorr ncia de Michael Porter Os jogos de guerra s o eventos onde v rias equipes representando organiza es num mercado concorrencial tentam esbo ar estrat gicas competitivas para superar seus advers rios e exp las para um grupo moderador do jogo Fuld 2007 p 53 assim define esse recurso metodol gico Um jogo de guerra n o significa apenas ganhar ou perder Significa retir lo de sua zona de conforto e ajud lo a obter uma atual e realista vis o da paisagem competitiva Isso permite a voc testar a extens o da for a de sua pr pria estrat gia e examinar melhor a de seu concorrente uma simula o viva que reflete o mundo real for ando concorrentes clientes e poss veis entrantes a exporem suas estrat gias FULD 2007 p 53 A elabora o das estrat gias deve valer se de toda informa o considerada til no contexto tais como not cias de fatos e tend ncias al m de cen rios evolutivos do mercado e das pr prias organiza es O grupo moderador deve estabelecer as regr
2. Conceitos Integrados em Research Contexto Microsoft Research 178 Figura 6 17 Modelo Mental Comparativo dos Conceitos de Neg cio Minerados 182 Figura 6 18 Ciclo de Modelagem Conceitual Recursiva 187 Figura 6 19 Reticulado de Conceitos do Contexto Warning System for Automobiles 188 Figura 6 20 Reticulados de Conceitos Recursivos 189 Figura 6 21 Gr fico Conceitual de Warning System no Contexto IBM Research 190 xiv Figura 7 1 Modelo de Minera o de Conceitos de Neg cio para Intelig ncia Competitiva 199 Figura 7 2 Modelos de Classe Can nicos 200 XV 1 INTRODUCAO O texto a seguir apresenta a defesa de uma tese na qual ser poss vel o desenvolvimento de um construto epistemol gico para minera o e modelagem de informa o conceitual relevante a partir de textos digitais dispon veis em fontes abertas como praxis de gest o do conhecimento a priori para Intelig ncia Competitiva IC nas organiza es de mercado Estipula se como premissas para esta tese que o estado da arte da Intelig ncia Artificial IA e das ferramentas de Processamento da Linguagem Natural PLN suportar numa abordagem de Engenharia do Conhecimento o desenvolvimento de uma metodologia com este objetivo Como vantagens para a gest o do conhecimento nos ambientes das organiza es a Engenharia do Conhecimento proporciona SCHREIBER et al 2000 p 7 e ferramentas para identific
3. Em suma observam se as seguintes composi es de tipos de conte dos de textos e sinais gr ficos nessas camadas de um Web Portal Corporativo do porte pesquisado l Camada de 1 P gina e sinais de linguagem de marca o para controle de acesso ao s tio informa es e bot es de navega o no s tio lemas frases de vis o empresarial not cias corporativas nuvem de tags Il Camada de 2 P gina informa es e bot es de navega o no s tio lemas de vis o empresarial not cias corporativas informa es organizacionais detalhes sobre os temas da 1 p gina conex es de hipertexto para baixar documentos download blogs corporativos outros Ill Camada de 3 P gina informa es e bot es de navega o no s tio lemas frases de vis o empresarial not cias corporativas 112 e textos com desenvolvimento dos temas da 1 e da 2 p ginas e conex es de hipertexto para baixar documentos download e outros Os textos da 1 camada s o teis para a presente pesquisa porque apresentam sintagmas abstratos com alto poder sem ntico para defini o de conceitos antigos e novos sobre o neg cio e a organiza o tais como credit card investment services Bayer Healthcare creditor s rights Heineken Experience business solutions etc Observam se poucos verbos nesta camada que mais caracterizada por substantivos indicando conceitos Assim denominamos esta camada dos por
4. O ltimo ato de um processo de minera o de dados ou de textos para o aprendizado de conceitos num contexto aquilo que Choo 2003 denomina nos ambientes organizacionais constru o do conhecimento o ponto em que os engenheiros do conhecimento precisam mostrar o resultado do processo o produto elaborado de intelig ncia que denominamos conhecimento Esse conhecimento tamb m precisa ser til para tomada de decis o no contexto de neg cio onde se insere a organiza o que patrocina os investimentos em Intelig ncia Competitiva Considerando se o modelo de intelig ncia proposto onde o conhecimento representado por conceitos elicitados a partir de uma base de informa o textual deve se separar dos conceitos elicitados aqueles que representam a informa o mais relevante para o desenvolvimento de insights nesse aspecto que a relev ncia da informa o no caso associada com oportunidades de gera o de nova informa o sobre informa o ou em s ntese de novas elabora es mentais que propiciem a gera o do conhecimento til para a organiza o Os construtos epistemol gicos da literatura discutida a seguir apontam cada um a seu modo mas com not vel converg ncia para o conceito de diferen a ou contraste no reconhecimento de padr es em modelos mentais como a chave para a percep o da relev ncia da informa o Esses construtos apesar de desenvolvidos em sua maioria a partir do estudo da c
5. Sejam a b c os segmentos de reta conectando os v rtices de um tri ngulo com os pontos m dios dos lados opostos O ponto de intersec o de a e b ent o o mesmo que o ponto de intersec o de b e Deste modo temos diferentes designa es para o mesmo ponto e esses nomes ponto de intersec o de a e b ponto de intersec o de b e c do mesmo modo indicam o modo de representa o e ainda a declara o cont m o conhecimento no caso As no es de sentido e referente aparecem no argumento de Frege 2003 para distinguir o objeto ou referente que o ponto de intersec o dos dois segmentos de reta no interior do tri ngulo de seu modo de representa o geom trica ou sentido O modo de representa o estaria contido no sentido do s mbolo e o objeto como uma refer ncia desse s mbolo Complementando o exemplo do tri ngulo com outro o da estrela da manh que o planeta V nus Frege 2003 p 37 argumenta que o referente da estrela da tarde seria o mesmo que o da estrela da manh mas n o o sentido Em termos pr ticos com Frege 2003 conclui se que um referente um objeto identificado e definido no mundo uma inst ncia de uma classe de objetos portanto mas os sentidos que se referem a esse objeto podem envolver mais de um conceito ou rela o Considerando se que textos publicados de organiza es processos e produtos envolvem co
6. como de 8 interessante observar se neste ponto o conceito de informa o encontrado em Peirce 2010 p 107 a soma das proposi es sint ticas na quais o s mbolo sujeito ou predicado antecedente ou consequente Collocates s o palavras que ocorrem na vizinhanga de sua palavra utilizada como argumento de busca Collocates de carta podem incluir correio selo envelope etc No entanto palavras muito comuns como a podem tamb m colocar com carta SCOTT 2008 p 94 Collocation portanto um modo de minera o de texto em que se define a priori como argumentos de busca um conjunto de palavras ou padr es sint ticos e as respectivas posi es coloca es de seus componentes na frase 96 pragas um tipo espec fico de atividade de controle constituindo aquilo que na gram tica se denomina locu o com substantivo adjetivado E quando finalmente comp e se a express o sintagm tica mais completa empresa de controle de pragas resta pouca ambiguidade quanto ao tipo de empresa da qual se trata ou aos significados das palavras controle e pragas no contexto da informa o O problema da ambiguidade na recupera o da informa o textual desdobrado na polissemia e na sinon mia tem atormentado os estudiosos da recupera o da informa o por d cadas sem solu es triviais KONCHADY 2006 Meadows et alii 2007 por exemplo colocam o problema da
7. o apresentam caracter sticas de Intranets ou redes de conte dos digitais com tecnologia da Internet para uso interno nas organiza es Davydov 2001 p 131 apresenta esse tipo de Web portal como uma m dia de massa para colabora o e intera o entre indiv duos e seus computadores acrescentando ainda que No campo emergente dos portais corporativos a principal meta expor e entregar informa o relevante e espec fica do neg cio num contexto de aux lio aos modernos empregados para que os mesmos sejam produtivos e competitivos E para ser produtivo e competitivo requer se n o somente acesso a informa o mas tamb m uma habilidade para interagir comunicar se com os outros utilizando a informa o obtida como base de Servi os do Neg cio S tio Web Portal de Orientado ao Informa o Trabalho Consumidor Corporativo e Business TE m Portal Portal de TEE E Portal de Corporativo Intelig ncia e 3 sto do i Colabora o Estendido de Neg cio Corporativo Portal de Transa es de Mercado Portal de Servi os de Aplica o Figura 5 4 Classifica o Evolutiva dos Web Portais Fonte DAVYDOV 2001 O objetivo de entrega de informa o til de qualidade para os colaboradores e parceiros na organiza o endere ado a dois subtipos de portais especializados os portais de Intelig ncia de Neg cios Business Intelligence com acr nimo Bl no idioma original e os portais de Gest o do Conh
8. BUCKLEY C Term weighting approaches in automatic text retrieval nformation Processing and Management v 24 n 5 p 515 523 1988 SANDERSON M CROFT B Deriving concept hierarchies from text n Proceedings of the SIGIR Conference on Research and Development in Information Retrieval 1999 p 206 213 SANTOS C cero Nogueira dos Aprendizado de m quina na identificac o de sintagmas nominais o caso do Portugu s brasileiro Disserta o de Mestrado Instituto Militar de Engenharia Rio de Janeiro 2005 SARACEVIC Tefko Information Science Journal of the American Society for Information Science v 50 n 12 p 1051 1063 1999 SAUSSURE Ferdinand de Escritos de Ling stica geral Organizados e editados por Simon Bouquet e Rudolf Engler Tradu o de Carlos Augusto Leuba Salum e Ana Lucia Franco S o Paulo Cultrix 2002 SAYOOD Khalid ntroduction to data compression Morgan Kaufmann 2000 SCHREIBER Guus AKKERMANS Hans ANJEWIERDEN Anjo DE HOOG Robert SHADBOLT Nigel VAN DE VELDE Walter WIELINGA Bob Knowledge Engineering and Management The CommonKADS Methodology Cambridge MA EUA e London Reino Unido MIT 2000 SCHREIBER Guus WIELINGA Bob BREUKER Joost KADS A principled approach to knowledge based system development Academic Press 1993 SCHUTZ A BUITELAAR P RelExt A tool for relation extraction from text in ontology extension In Proceedings of the International Semantic Web
9. Tecnologia da Informa o e Comunica o UEFA Union of European Football Associations viii UML Unified Modelling Language URL Uniform Resource Locator WWW World Wide Web RELA O DE TABELAS Tabela 3 1 Dominio Turismo como Contexto Formal 39 Tabela 3 2 Contexto Formal de Animais Famosos 41 Tabela 5 1 Fontes e Usos de Informa o para Intelig ncia Competitiva 139 Tabela 6 1 An lise de Conceito Formal com as Cinco For as de Porter 143 Tabela 6 2 Simula o Gen rica de Minera o Conceitual Recursiva Contexto Warning System for Automobiles 188 Tabela 6 3 Altera es de Posi es Relativas de Frequ ncias com Atualiza o da Base 193 RELAC O DE GR FICOS Gr fico 5 1 Curvas de Repeti o de Termos na Amostra Textual 119 Gr fico 5 2 Raz o entre Substantivos e Palavras na Amostra de Textos 120 Gr fico 5 3 Percentuais de Conex o Sintagm tica de Substantivos 121 Gr fico 5 4 Curvas de Conex o Sintagm tica dos Substantivos mais Frequentes 122 xi RELA O DE QUADROS Quadro 4 1 Fluxo Operacional Experimental 86 xii RELA O DE FIGURAS Figura 1 1 Organiza es Fundamentadas na Informa o e no Conhecimento 5 Figura 1 2 Estruturas Sint ticas de Texto em Linguagem Natural 8 Figura 1 3 Modelo Ontol gico de Sistema de Informa o 9 Figura 2 1 rvore de Problemas 16 Figura 3 1 Reticulado de Conceitos
10. durante o processamento para recupera o dos padr es de informa o presentes na base 84 4 REFERENCIAL TE RICO E METODOLOGIA DA PESQUISA 4 1 Fundamenta o metodol gica A metodologia desenvolvida na tese consiste num processo de reengenharia reversa como mencionado por Cimiano 2006 sendo proposta sua aplica o num contexto espec fico o da modelagem de sistemas de neg cios nas organiza es competitivas Em termos filos ficos essa engenharia reversa se fundamenta na premissa da exist ncia de elos epist micos entre o pensamento e a linguagem O pensamento seria o mundo dos conceitos e modelos e a linguagem o mundo da informa o primordial dispon vel em meio digital O construto proposto al m da fenomenologia tamb m se fundamenta na an lise sint tica estruturalista de Chomsky 1956 em teorias l gico matem ticas de conjuntos em teorias de conceitos de Arist teles 1969 1995 Peirce 1909 2010 Sowa 1984 e Wille 1982 1997 2005 e quanto relev ncia da informa o e cria o de significados na Teoria da Informa o de Shannon SAYOOD 2000 e nas teses psicol gicas de Bateson 2002 Weick 1995 e Choo 2003 Peirce 2010 por exemplo considera que ci ncia da Semi tica ou ci ncia dos signos que abrange as quest es de cria o de significado centrais nesta tese tem tr s ramos gram tica especulativa ou gram tica pura l gica e ret rica pura Com os experimentos executad
11. es do mercado 10 interessante perguntar se a prop sito por que a conhecida organiza o The American Society for Information Science ASIS mudou em 2000 seu nome para American Society for Information Science and Technology ASIST acrescentando o T em sua sigla Collocation corresponde a um padrao qualquer de posicionamento de palavras observado repetidamente em linguagem natural no qual algumas palavras aparecem na vizinhan a da palavra utilizada como argumento de busca SCOTT 2008 Conforme Cheng Greaves amp Warren apud Scott 2008 p 224 concgram o conjunto de permuta es da varia o constitutiva e posicional gerada pela associa o de duas ou mais palavras significando que um concgram em particular pode constituir a fonte para um n mero de padr es de posicionamento collocation 11 sua import ncia reconhecida al m dos limites das bibliotecas no universo da World Wide Web e das grandes empresas fabricantes de softwares para esta es de trabalho A terceira grande quest o um problema de engenharia par excellence que exige o desenvolvimento de tecnologias espec ficas para solu o de problemas Esta tese baseada num experimento de laborat rio mas obviamente com intui o racional aprior stica re ne caracter sticas de engenharia que poder o contribuir para o aumento do desempenho dos processos de busca inteligente por informa es conceituais em reposit rios digitais O con
12. es e os ambientes reais geralmente n o se repetem naturalmente de modo muito similar d seguran a uma simula o geralmente n o apresenta riscos para as organiza es ou pessoas o que nem sempre ocorre em experimentos reais experi ncias reais mal sucedidas podem acarretar danos ambientais e ou preju zos para as pessoas e organiza es 90 4 2 2 Aplicac o do m todo na pesquisa O uso de simula o computacional na pesquisa que embasa a tese apresenta todas essas vantagens superando se o problema do desenvolvimento de softwares complexos para modelagem do ambiente de simula o utilizando se softwares existentes e dispon veis especialmente produtos shareware e freeware com custos muito reduzidos ou isentos de custos de licenciamento Com tais produtos o tempo para implementa o do modelo no ambiente computacional reduzido ajustando se s necessidades do projeto A Figura 4 3 mostra num modelo de atividade da UML as a es da pesquisa partindo da concep o do projeto revis o de literatura e avalia o de teorias e em que ponto do trabalho de pesquisa integrado o ambiente de simula o computacional Os experimentos laboratoriais previstos no fluxo de atividades para execu o a o Executar Experimentos com uso de simula o computacional aparecem ap s a sele o e montagem do modelo experimental na fase anterior na a o de Selecionar Estrat gias Elaborar Tese projetoPr Habilit
13. mais informativo dizer que uma rvore do que dizer que uma planta Al m disso porque as subst ncias primeiras s o sujeitos de todas as outras coisas e todas as outras coisas ou se predicam delas ou existem nelas que elas s o principalmente chamadas subst ncias Esta escolha do modelo Aristot lico para teste deveu se aos pr prios fundamentos dessa filosofia que aparentemente se mostraram abertos an lise de conceitos para al m da an lise puramente sint tica como nas seguintes passagens da obra citada ARIST TELES SANTOS 1995 p 84 85 com grifos nossos Sendo a teoria das categorias um elemento essencial da filosofia aristot lica s o muitas as obras e as passagens onde Arist teles a apresenta Do estudo dessas passagens conclui se que as categorias s o os g neros supremos da realidade As categorias s o ent o apresentadas nesta passagem como os g neros a que pertencem as coisas significadas pelas express es ling sticas simples Desta classifica o dos g neros pode evidentemente derivar se uma classifica o correspondente das pr prias express es express es que significam uma subst ncia express es que significam uma quantidade etc Mas n o este o objetivo principal de Arist teles O que ele pretende classificar s o as coisas significadas e n o as express es que as significam O que equivale a tomando a linguagem como quia efetuar uma classifica o dos g neros mais elevados de to
14. o que uma empresa tem operar t o eficientemente e efetivamente quanto poss vel Efetividade operacional pode ser pensada como uma estrat gia na verdade como a nica estrat gia apropriada em mercados sem barreiras contra a entrada Outra vis o um tanto discordante e c tica de Greenwald e Kahn 2005 p 6 7 em rela o as cren as gerais sobre competitividade empresarial se refere s fontes da pr pria competitividade Em um ambiente global crescente com menos barreiras comerciais transportes mais baratos fluxos de informa o mais velozes e competi o implac vel tanto de rivais estabelecidos como de economias recentemente liberalizadas pode parecer que vantagens competitivas e barreiras contra entrada dever o diminuir mas esta macro vis o perde uma caracter stica essencial das vantagens competitivas que vantagens competitivas s o quase sempre embasadas no que s o essencialmente circunst ncias locais Concluindo este cap tulo com base na resenha apresentada anteriormente sobre fontes e usos da informa o til para desenvolvimento de insights de Intelig ncia Competitiva prop e se ent o o mapa contextual da Tabela 5 1 com as incid ncias de atributos de usos das principais fontes gen ricas O exerc cio busca estabelecer algumas prov veis correla es entre as atividades de elabora o de Intelig ncia Competitiva descritas anteriormente aqui denominadas alerta antecipado jog
15. 14 Work 35 Science 49 15 Redmond 34 Group 42 XE m Data 37 29 Overview 20 Embora se deva considerar que alguns substantivos nomes do novo texto j se encontravam na base preexistente com freq ncia elevada como o caso de people software e Microsoft a normatizac o das freq ncias dos conte dos novos produzem um efeito que interessa no contexto a eleva o virtual das frequ ncias de alguns objetos novos como Yahoo e Gates Yahoo em particular dever se situar em nono lugar no novo ranking de frequ ncias ap s a normaliza o Esses objetos constituem novidades que s o destacadas no novo ranking de substantivos nomes mais frequentes no modelo conceitual e que portanto dever o receber mais aten es do engenheiro do conhecimento ap s a atualiza o da base A descoberta da novidade relacionada com o nome Yahoo no caso ser de import ncia vital para o analista de intelig ncia operando numa organiza o concorrente da Microsoft no mercado como o caso da Google por exemplo A pergunta que esse analista deveria fazer de plano seria a mais simples poss vel o que a Microsoft est querendo com o pessoal do Yahoo Com esse simples experimento resta evidente mais uma vez a import ncia da associa o de termos l xicos de conte dos e de contextos na minera o filtrando se melhor os resultados de modo a tornar a busca mais eficiente Enfim o c
16. Intelig ncia organizacional e competitiva Bras lia UnB 2001 TESNIERE Lucien Elements de syntaxe structurale Paris Librairie C Klincksieck 1959 TONG Richard M ASKMAN Victor N CUNNINGHAM James F TOLLANDER Carl J RUBRIC an environment for full text information retrieval Association for Computing Machinery 1985 TURCATO D POPOWICH F TOOLE J FASS D NICHOLSON D TISHER G Adapting a synonym database to specific domains n Proceedings of the ACL Workshop on Hecent Advances in Natural Language Processing and Information Retrieval 2000 212 VALTCHEV P MISSAOUI R GODIN R Formal Concept Analysis for knowledge discovery and data mining the new challenges In EKLUND P Ed Concept Lattices 2 International Conference on Formal Concept Analysis LNCS 2961 Berlin Springer 2004 p 352 371 VAZ Maria Elizabete Integra o de dados al m da tecnologia Mostra TIC 2007 Bras lia DF Dispon vel em lt http www solucoestipublica gov br grade_palestras gt Acesso em 11 maio 2007 VELARDI P NAVIGLI R CUCHIARELLI R NERI F Evaluation of OntoLearn a methodology for automatic population of domain ontologies In BUITELAAR P CIMIANO P MAGNINI B Eds Ontology Learning from Texts Methods Applications and Evaluation Frontiers in Artificial Intelligence and Applications IOS Press n 123 2005 p 92 106 WEICK Karl E Sensemaking in organizations SAGE 1995 WEILKIENS
17. Objetivamente este autor define em seu framework de recupera o da 9 Crawler programa de computador rob que recupera e categoriza informa es da Web Utilizando se no caso recupera o como um termo mais gen rico hiper nimo de extra o 28 informa o que uma proposi o uma unidade constitu da de sentido e que maior que o significado de uma palavra e menor que uma narrativa ou uma teoria 3 2 3 Processamento da linguagem natural O processamento da linguagem natural se ocupa da extra o de representa es de significados a partir de textos livres para se descobrir quem faz o que para quem quando onde como e porque KAO POTEET 2007 Esta defini o pragm tica til para a contextualiza o do problema de minera o de informa es abordado na pesquisa e as metodologias selecionadas para o experimento emp rico A extra o de rela es sint ticas e sem nticas entre entidades termos ou estruturas de um texto considerada uma tarefa importante e desafiadora no campo do PLN presente na literatura tanto em obras mais antigas como mais recentes WINOGRAD 1972 BORKO 1981 WILKS 1975 WINOGRAD 1983 BALLARD e TINKHAM 1984 BITTLESTONE 1985 DOSZKOCS 1986 BARNETT KNIGHT MANI e RICH 1990 HOBBS APPELT BEAR e TYSON 1991 DAELEMANS GAZDAR e DE SMEDT 1992 CHURCH e RAU 1995 KING 1996 BERRY 2004 KONCHADY 2006 KAO e POTEET 2007 MEADOW BOYCE KRAFT e BARRY 2
18. Por isso estima se que o n mero de m quinas em opera o das empresas l deres saia dos atuais 2 3 milh es para 1 7 milh o em 2014 Para tentar reduzir poss veis estragos os executivos de Cielo e Redecard est o pensando em alternativas A Cielo quer que as maquininhas gerem receita para seus clientes com a oferta de servi os financeiros Ao usar os aparelhos para pagamento de contas e recarga de celular o estabelecimento comercial estar atraindo um fluxo maior de clientes para o local e ainda ganha uma taxa por isso diz R mulo Dias presidente da Cielo Esse projeto j come ou a funcionar em grandes redes Desde o 151 come o do ano os clientes dos supermercados P o de A car podem sacar at 100 reais nos caixas com o cart o Visa A Redecard por sua vez vai intensificar sua estrat gia de disputar mercados com credenciadoras regionais com a do Banrisul que atua principalmente no Rio Grande do Sul e em Santa Catarina Al m disso tanto a Cielo quanto a Redecard pretendem conquistar novos clientes no Centro Oeste considerado pelas duas empresas como a nova fronteira dos cart es no pa s O brasileiro ainda usa muito cheque e dinheiro para pagar suas contas Temos muito espa o para crescer Repercuss o do Fim do Duop lio no Setor de Cart es Fronteira de Cart es N mero de Transa es Transa o Figura 6 5 Modelo Conceitual com Cart o de Cr dito Fonte do
19. Terry Language as a cognitive process volume l syntax Addison Wesley 1983 WITTGENSTEIN Ludwig Philosophical investigations Traduzido para o ingl s por G E M Anscombe 3 ed Malden Massachusetts EUA Blackwell 2001 YOON Jeonguon Realizando a u Cor ia n KNIGHT Peter Titcomb FERNANDES Ciro Campos Christo CUNHA Maria Alexandra Org e Desenvolvimento no Brasil e no Mundo subs dios e Programa e Brasil S o Caetano do Sul SP Yendis 2007 p 120 129 ZANASI A BREBBIA C A EBECKEN N F F E MELLI P Data mining III Southampton Boston WIT Press 2002 ZARRI Gian Piero RESEDA An information retrieval system using Artificial Intelligence and Knowledge Representation Techniques ACM SIGIR Forum v 17 n 4 p 189 195 1983 ZEMAN Jay Peirce s Graphs n LUKOSE Dickson DELUGACH Harry KEELER Mary SEARLE Leroy SOWA John Eds Conceptual structures fulfilling Peirce s dream Fifth International Conference on Conceptual Structures ICCS 97 Seattle Washington USA August 1997 Proceedings p 12 24 ZEMAN Jay The graphical logic of C S Peirce PhD Dissertation University of Chicago 1964 ZIPF G K Human behavior and the principle of least effort Addison Wesley 1949 213 APENSOS 214
20. Tim OESTEREICH Bernd UML 2 certification guide fundamental and intermediate exams San Francisco CA Morgan Kaufmann 2007 WERNER Oswald How to teach a network minimal design features for a cultural knowledge acquisition device or C KAD In EVENS Martha Walton Ed Relational Models of the Lexicon Representing Knowledge in Semantic Networks Cambridge University 1988 p 141 166 WILKS Yorick Methodology in Al and natural language understanding In Proceedings of the 1975 workshop on Theoretical issues in natural language processing p 130 133 Cambridge Massachusetts ACM Special Interest Group on Artificial Intelligence 1975 WILLE Rudolf Conceptual Graphs and Formal Concept Analysis In LUKOSE Dickson DELUGACH Harry KEELER Mary SEARLE Leroy SOWA John Eds Conceptual Structures Fulfilling Peirce s Dream Proceedings of the Fifth International Conference on Conceptual Structures ICCS 97 Seattle Washington USA August 1997 p 290 303 WILLE Rudolf Formal Concept Analysis as mathematical theory of concepts and concept hierarchies In GANTER Bernhard STUMME Gerd WILLE Rudolf Eds Formal Concept Analysis Foundations and Applications Springer 2005 p 1 33 WILLE Rudolf Restructuring lattice theory an approach based on hierarchies of concepts n RIVAL Ed Ordered Sets Dordrecht Boston Reidel 1982 p 445 470 WINOGRAD T Understanding natural language Edinburgh 1972 WINOGRAD
21. VAZ 2007 FERRER e LIMA 2007 GUTI RREZ 2007 YOON 2007 HOSKINS DOBBERNACK e KUPTSCH 2001 Observa se tamb m nos casos relatados na literatura que as solu es tradicionais de modelagem e desenvolvimento de SICs n o mais respondem satisfatoriamente aos desafios do ambiente de neg cio em constante muta o e McGee e Prusak 1994 citando Waller assim 24 P4 Premissa 1 P2 Premissa 2 C Conclus o 25 resumem com desalento o problema N o h ci ncia para constru o de uma met fora que permita a representa o dos requisitos de informa o de uma organiza o de uma forma compreens vel e utiliz vel por todos MCGEE PRUSAK 1994 p 143 Os processos de mudan as evolutivas no ecossistema organizacional apresentam pelo menos tr s pontos de dificuldade metodol gica consider vel para a concretiza o das solu es propostas pela reengenharia O primeiro deles se refere limitada capacidade do ser humano em lidar com a complexidade de modo imediato problema apresentado por McGee e Prusak 1994 citando uma argumenta o de Waller a respeito das rela es complexas entre os objetos de informa o das organiza es Quando os seres humanos enfrentam a complexidade precisam descobrir essas rela es e na vida organizacional comunic las entre si de forma intelig vel A z manipula o consciente de elementos e rela es entretanto uma fun o da mem ria imediata essa pa
22. amp Reuters Dialog Lexis Nexis e o Wall Street Journal A no o de padr o na Ci ncia est associada necessidade de generaliza o 99 Outra das mais conhecidas fontes pr nternet a Bloomberg empresa fundada em 1981 com a seguinte vis o de neg cios criar um servi o de informa o e uma empresa de m dia e not cias que disponibilizasse aos profissionais de neg cios e de finan as as ferramentas e os dados que eles necessitam numa Unica e abrangente plataforma ver http about bloomberg com company html Deve se ressaltar no entanto que mesmo antes do advento da nternet e da World Wide Web existiam fontes de informa o de qualidade acess veis por redes de computadores dedicadas Fuld 2007 p 156 contextualiza essas fontes e sua evolu o mais recente esclarecendo que Embora os servi os de informa es on line cobrados tenham sido marginalizados nessa era de informa o gr tis alguns t m durado desde o final dos anos 60 e ainda s o superiores para informar na Web de gra a particularmente em rela o ao ndice de not cias tradicionais e de bases de dados cient ficas Sistemas de servi o de informa o como o Dow Jones amp Reuters Factiva o Dialog ou o Lexis Nexis t m supervis o editorial e permitem ao pesquisador mais controle e confian a de que ele ou ela encontrar o correto peda o de informa o No caso do Factiva todo o sistema indexado o que signif
23. armazenamento organiza o processamento e an lise dos dados contaram com suporte tecnol gico de um mini laborat rio de Processamento da Linguagem Natural PLN composto por um microcomputador e alguns softwares com as seguintes especifica es b sicas Microcomputador notebook HP Pavilion Entertainment PC com microprocessador Intel Core 2 Duo T 6600 barramento de 2 2 GHz 4 GB gigabytes de mem ria RAM e 500 GB de capacidade de armazenamento de dados no disco r gido Il Sistema Operacional Microsoft Windows 7 Home Premium de 64 bits Ill Rede de Acesso Internet no cabo da ltima milha externa at o hub local e wireless do hub at a estac o de trabalho microcomputador pessoal IV Editor de Textos Microsoft Word 2003 V Planilha Eletr nica Microsoft Excel 2003 VI Aplicativos de PLN e Etiquetador TreeTagger desenvolvido por Helmut Schmid no Institute for Computational Linguistics of the University of Stuttgart Alemanha com parametriza o para o idioma ingl s desenvolvida na University of Pennsylvannia EUA e interface gr fica para Sistema Operacional Microsoft Windows XP desenvolvida por Ciaran Duibh n um software livre dispon vel em http www ims uni stuttgart de projekte corplex TreeTagger e Analisador Sint tico Estat stico e Aplicativo de Minera o de Textos WordSmith desenvolvido por Mike Scott e comercializado na Web em http www lexically net wordsmith e Reticul
24. com possibilidades explanat rias do que um corpo de conhecimento O termo negentropia uma contra o de entropia negativa negative entropy ou negentropy tamb m conhecido como sintropia syntropy atribu do ao f sico Erwin Schr dinger em seu livro What is Life de 1943 sendo aplicado a contextos de sistemas vivos como a entropia que o sistema exporta para manter sua pr pria entropia em n vel baixo Outro exemplo de Bateson 2002 p 92 se deve ao argumento metaf rico de Berkeley o fato que acontecer na floresta ser sem sentido se o indiv duo n o estiver l para ser afetado pelo mesmo 80 E a id ia central de fundo psicol gico apresentada de modo bastante intuitivo A cria o de significado testada ao extremo quando as pessoas encontram um evento cuja ocorr ncia t o implaus vel que elas hesitam em report la com medo de n o terem cr dito WEICK 1995 p 1 Essa id ia central permite uma modelagem de Engenharia do Conhecimento para torn la operacional num ambiente de minera o conceitual da informa o como veremos no Cap tulo 7 O psicologismo de Weick 1995 acess vel a partir de nossa experi ncia mental do dia a dia como seres humanos Ele oferece uma fundamenta o bastante s lida para o uso de modelos mentais e linguagem natural para representa o de conceitos relevantes nas organiza es As organiza es tamb m t m suas pr prias linguagens e s mbolos que produze
25. development of operations in China The large number of dispatched employees requires a substantial payroll and because many business transactions are done among Japanese companies the procurement costs are also high In addition excessive attention to quality increases costs This is also connected with Japanese style management 4 In terms of organization the transfer of authority from Japanese companies to subsidiaries in China is insufficient and these subsidiaries have little independent discretionary power As a result strategic development of operations in China is difficult Profits in China are low and consequently many companies receive compensation from the home company to stay in the black Furthermore the supervising companies in China are not functioning properly 5 The weakening presence of Japanese companies in China their inadequate commitment to social contribution their sluggish response to unforeseen incidents or scandals and etc have hurt the image of these companies among Chinese society and are having a negative impact on their operations development 6 Regarding market strategy insufficient entry into the Chinese market and weakness in organizational control represent problems Strategic procurement and the restructuring of operations in response to market shifts are slow 7 To rectify these problems and improve business it is necessary that Japanese companies organize business strategies for Chinese operat
26. e c rculos que concentram mas abaixo os ret culos nos pontos em que estes se cruzam compondo um modelo de informa o conceitual sobre os objetos e seus atributos no contexto Conforme o m todo da An lise de Conceito Formal cada c rculo intermedi rio do reticulado representa um conceito agrupando objetos com os mesmos atributos e as linhas do reticulado que unem os c rculos representam as rela es matem ticas entre esses conceitos O modelo conceitual da Figura 5 10 apresenta uma alta densidade ou polui o de conceitos e rela es porque o n mero de objetos utilizado sem um corte por faixa de frequ ncia relativamente elevado perto de mil para esse tipo de representa o da informa o Observe se que logo abaixo do primeiro c rculo no topo do gr fico da Figura 5 10 aparece o c rculo indicando o conceito de Modelo de Insumo Produto que agrupa um conjunto de objetos sintagm ticos com os mesmos atributos no contexto As caixas de texto pela restri o de espa o no modelo pict rico mostram apenas os tr s primeiros objetos mas essa interface do aplicativo apresenta um bot o onde ao se clicar no mesmo aparecem os demais objetos do conceito Os conceitos mais abaixo resultam de diferentes composi es de mais de um atributo como por 134 exemplo o conceito resultante da composi o dos atributos do Modelo de Insumo Produto e Modelo de Ambiente Externo Os primeiros objetos d
27. experimentalmente uma metodologia que possa propiciar uma base de informa o conceitual sobre os contextos de neg cios das organiza es de modo a propiciar a modelagem de sistemas organizacionais de modo mais autom tico tempestivo e compreensivo Em s ntese reconhecendo se como premissa a vis o sist mica das organiza es complexas em ambientes competitivos apresenta se uma tese na qual organiza es mais competitivas s o aquelas com melhor base epistemol gica e capacidade para reconhecer a necessidade de mudan as em seus sistemas de neg cios e maior capacidade de implement las de modo eficaz eficiente e efetivo A literatura de base sobre este t pico introdut rio vasta sendo apresentada em linhas gerais no Cap tulo 4 1 2 Gest o da informa o e do conhecimento A contribui o do presente trabalho de pesquisa rea de estudos denominada Gest o da Informa o e do Conhecimento de natureza instrumental e pragm tica com uma abordagem de Engenharia e Gest o do Conhecimento SCHREIBER et al 2000 mas algumas reflex es te ricas e teses derivam de seus resultados O conceito de gest o do conhecimento adotado 4 n o algo inovador mas baseado em conceitos anteriores mais disseminados como gest o da informa o gest o de pessoas gest o do capital intelectual e gest o da tecnologia da informa o e comunica o Esta concep o parte da premissa que n o pos
28. ied Yojo Objeto s mbolo Figura 3 12 Tri ngulo de Significados de Sowa Fonte CIMIANO 2006 rvores de conceitos s o construtos teis para a classifica o de objetos e seres na natureza geralmente empregados por taxonomistas na Biologia Qu mica Ling stica e outras reas do conhecimento cient fico e tamb m nas organizag es O recurso metodol gico da classifica o de objetos constitui o n cleo conceitual dos processos de desenvolvimento de software na atualidade GIGUETTE 2006 com tend ncia de extens o de seus conceitos tamb m para os dom nios de processos de neg cio e seus fluxos de atividades nas organiza es 66 O m todo portanto apresentado como ferramenta auxiliar dos arquitetos de informa o na constru o de rvores de conceitos para desenvolvimento de AOS nas organiza es com objetivo de suprir uma lacuna existente nos m todos tradicionais de modelagem de processos e softwares Os m todos de modelagem tradicionalmente utilizados por engenheiros de sistemas tais como os baseados na Unified Modeling Language UML dependem de intera es pessoais entre analistas de sistemas e usu rios com pouco ou nenhum uso da informa o documental existente nas organiza es ao passo que com ACF pode se extrair do acervo de informa es legadas textos com suporte papel ou digital de uma ou sobre uma organiza o termos ling sticos que poder o ser classificados como conceitos teis
29. impossibilidade filos fica fenomenol gica da exist ncia de dado adota se nesta tese um conceito tautol gico e pragm tico dado o conte do de um banco ou de uma base de dados os dados utilizados no experimento de laborat rio analisados no Cap tulo 5 foram extra dos da maior base de dados digital aberta existente a World Wide Web 20 Association for Computing Machinery ACM com fontes de refer ncia bibliogr fica de embasamento do presente projeto de pesquisa confirmando as conclus es de Saracevic 1999 quanto ao perfil desses profissionais da informa o Os artigos seminais de Luhn 1957 Good 1958 Doyle 1965 Minsky 1968 Salton 1970 e outros at contribui es mais recentes podem ser encontrados na biblioteca digital da ACM A obra de Ara jo Jr 2006 oferece uma vis o panor mica condensada do estado da arte das metodologias e tecnologias desenvolvidas para recupera o autom tica de informa o comparando o desempenho de processos manuais com processos baseados em computa o eletr nica Essa obra mostra que a RI executada com software pode n o apresentar vantagem qualitativa sobre o processamento manual do ponto de vista da precis o ainda que com a automa o os ganhos em velocidade sejam inquestion veis Entretanto do ponto de vista da gest o do conhecimento o maior desafio continua sendo o da recupera o inteligente de informa o dessas fontes brutas textos livres udio
30. intuitivamente n o se encaixavam bem nas categorias definidas at ent o optou se pela inclus o de mais uma categoria denominada modelo de insumo e produto O problema que se apresentou a seguir se deveu aus ncia de metadados acerca da natureza de cada categoria cuja solu o se buscou na pr pria taxonomia CommonKADS e nos conceitos econ micos de insumos e produtos Com as defini es a seguir prosseguiu se nas atividades de Classifica o de Sintagmas e Elabora o do Contexto integrantes do processo expresso na Figura 5 9 Modelo de Organiza o compreende para fins de classifica o i os atributos de objetos sintagm ticos que se refiram s caracter sticas da pr pria organiza o analisada ou de outras organiza es parceiras ou n o como BM s Haifa Research Lab e ii os atributos que lembrem em quaisquer circunst ncias a no o de organiza o das coisas no mundo dos neg cios tais como enforcement of a corporate privacy policy enterprise clients nuances of the business world e outros Modelo de Tarefa compreende os atributos de objetos que podem ser considerados como partes de processos produtivos ou de gest o exceto os insumos e produtos em geral substantivos derivados de verbos representando processos atividades e tarefas se referem a esse atributo como os presentes nos objetos sintagm ticos distribution operations supply chain relationships power of informatio
31. liberada em 2003 Ela se tornou uma linguagem padr o de modelagem de sistemas computacionais a partir das chamadas de propostas de padroniza o Request for Proposals RFP do Object Management Group OMG e de sua aceita o no final de 1997 Corroborando teses defendidas no escopo da Arquitetura Orientada a Servi os Service Oriented Architecture SOA Booch Rumbaugh e Jacobson argumentam que embora o principal produto de uma equipe de desenvolvimento de sistemas seja o c digo fonte de um software o desenvolvimento de um software de qualidade elevada requer uma s lida funda o de arquitetura 56 que seja resiliente a mudan as O uso de modelos nesse contexto se justifica a partir do pr prio conceito de modelagem e sua finalidade Um modelo uma simplifica o da realidade N s constru mos modelos de modo que possamos melhor entender o sistema que estamos desenvolvendo N s constru mos modelos de sistemas complexos porque n o podemos compreender tal sistema em sua totalidade Modelagem uma t cnica de engenharia comprovada e bem aceita N s constru mos modelos de arquitetura de casas e edif cios para auxiliar seus usu rios visualizarem o produto final N s podemos at construir modelos matem ticos para analisar os efeitos de ventos ou terremotos em nossas edifica es Nos campos da sociologia economia e gest o de neg cios n s constru mos modelos de modo que possamos validar teorias existentes o
32. m todos superficiais de abordagem como os de estilo saco de palavras continuam a dominar a rea de recupera o da informa o E arremata argumentando que o impacto da subdisciplina de PLN nas tarefas de recupera o da informa o tem largamente sido mais de promessa que de subst ncia LEASE 2007 p 1 34 3 2 4 Minera o de textos Os m todos e processos de descoberta de informa o que alguns chamam em certos contextos de conhecimento relevante em linguagem natural conhecidos como minera o de textos constituem variantes do que se conhece como minera o de dados Chauke Nehme 2008 como justificativa para os investimentos em pesquisa e desenvolvimento e o enorme interesse do mercado em tecnologias dessa natureza argumenta que um importante desafio para os pr ximos dez anos a prepara o de um ex rcito de Davi para tirar vantagem do volume de informa es dispon veis exponencialmente crescente no mundo em favor de uma sociedade mais s bia justa e igualit ria em termos de oportunidades para todos Este autor observa que a minera o de textos que constitui um dos tipos de tecnologias teis para o tratamento adequado da inunda o de informa es do mundo contempor neo tem apresentado uma significativa evolu o na ltima d cada desde o simples processamento de palavras na segunda metade da d cada de 1990 at hoje quando o processamento de conceitos termos ontol gicos ou
33. o M dia Desvio Padr o Gr fico 5 4 Curvas de Conex o Sintagm tica dos Substantivos mais Frequentes Com esta primeira parte do experimento conclu da restou evidente que o m todo de minera o de conceitos elaborado pode ser bastante eficiente de modo a abranger a maior parte dos substantivos nomes mais frequentes de um texto Ou ainda razoavelmente eficiente caso se queira analisar todos os nomes substantivos que aparecem num texto da Web corporativa sem uso de recursos adicionais para desambigua o como evidenciado no pr ximo cap tulo Os carnudos substantivos de Lispector 1998 podem ser portanto assim recuperados com uso das metodologias e tecnologias de PLN utilizadas Com isso tem se acesso informa o sobre os temas tratados com mais nfase pelas organiza es em seus Web Portais corporativos numa abordagem de minera o de textos para posterior modelagem de conceitos de neg cio com miss o algo parecida da Modelagem Essencial de Dados MED 122 As propriedades estat sticas de textos digitais em linguagem natural descobertas no experimento tamb m refor am o modelo estat stico de relev ncia da informa o de Zipf 1949 baseado na curva logar tmica que apresenta no eixo horizontal a posi o rank em termos de ordem da maior freq ncia para a menor e no eixo vertical o n mero de palavras repetidas em cada ordem de frequ ncia Como se observou no experimento desta tese os subs
34. o eficiente das atividades voltadas para a gest o da informa o e do conhecimento s o objeto de investiga o na pesquisa proposta Contudo ser necess ria a defini o de um m todo de modelagem operacional do problema e das poss veis solu es no contexto laboratorial da pesquisa assunto discutido a seguir Os dados a serem coletados no desenvolvimento da pesquisa dever o resultar do processamento do modelo de minera o de informa es em ambiente de simula es baseado em computador Com simula es baseadas em computador pretende se uma aproxima o experimental do mundo real das organiza es e suas fontes de informa es Os referenciais te ricos apresentados em publica es sobre uso de t cnicas de simula o em pesquisas na rea de ci ncias sociais s o um tanto escassos na literatura caracterizando se uma tend ncia hist rica de produ o acad mica mais intensa desse tipo de recurso metodol gico nas ci ncias exatas mais especificamente nas engenharias Encontra se contudo organiza es acad micas onde esse m todo mais popular com linhas de pesquisa dedicadas por exemplo na sociologia tais como o da Universidade de Surrey no Reino Unido GILBERT 2007 E Pidd 1988 argumenta que m todos de simula o computacional t m se desenvolvido desde o in cio dos anos 1960 onde se incluem talvez como as ferramentas mais comumente utilizadas para tanto as utilizadas na ci ncia da Administra o Em s
35. o metodologias de mapeamento entre classes e entidades de dados culminando com abordagens de modelagem l gica de sistemas de bancos de dados denominadas objeto relacional OR numa tentativa de aliar as vantagens da modelagem de dados Entidade Relacionamento ER com as vantagens de encapsulamento ontol gico e produtividade de c digo da modelagem OO Chen 1976 p 10 autor seminal da abordagem MER define uma entidade como uma coisa que pode ser identificada de modo distinto das demais e um relacionamento como uma associa o entre entidades como por exemplo pai filho um relacionamento entre duas entidades pessoa Outro conceito fundamental no MER o conjunto de entidades que esse autor apresenta com um exemplo do seguinte modo CHEN 1976 p 11 Denote se e uma entidade que existe em nossas mentes Entidades s o classificadas em diferentes conjuntos de entidades tais como EMPREGADO PROJETO e DEPARTAMENTO H um predicado associado a cada conjunto de entidades para testar se uma entidade pertence a ele Por exemplo se conhecemos uma entidade no conjunto de entidades EMPREGADO ent o sabemos que ela tem as propriedades comuns s outras entidades no conjunto de entidades EMPREGADO Entre essas propriedades se encontra o predicado de teste anteriormente mencionado Denote se E conjuntos de entidades Observe que conjuntos de entidades podem n o ser mutuamente disjuntivos Por exemplo uma entidade q
36. parsing Os passos seguintes desse m todo s o mais ou menos automatiz veis com uso de softwares estat sticos alguns parsers implementam an lise estat stica tamb m como o WordSmith desenvolvido na Universidade de Oxford e aplicativos de constru o de redes lattice builders e de organiza o de ontologias Protege ToscanaJ e outros Contudo ainda nao se conhece nenhum aplicativo integrado dispon vel no mercado como software propriet rio ou livre para implementa o de todas as fases do processo previsto no framework discutido neste cap tulo Como literatura de apoio para a fase seguinte de identifica o de termos sin nimos Cimiano 2006 recomenda as t cnicas de Harris 1968 baseada na hip tese que todos os termos que s o extens es de algum conceito num determinado contexto s o semanticamente similares Essa abordagem tem sido explorada por Grefenstette 1994 Turcato et al 2000 Buitelaar e Sacaleanu 2002 e Navigli e Velardi 2004 Outras t cnicas s o a Latent Semantic Indexing LSI com Landauer e Dumais 1997 e a Probabilistic Latent Semantic Indexing PLSI de Hoffman 1999 e suas variantes Existe no entanto uma tend ncia mais atual de utilizac o da pr pria WWW como um imenso corpus ling stico para pesquisa de sin nimos baseada em t cnicas estat sticas A extrac o de conceitos de textos uma tarefa um tanto pol mica exatamente em sua ess ncia ou seja em rela o defini o de
37. passing VVG pass the DT the 16 is VBZ be located VVN locate at IN at the DT the corner NN corner of IN of Grant NP Grant and CC and Seventh NP 17 raight RB straight through IN through the DT the traffic NN traffic light NN light crossing VVG cross over 18 through IN through the DT the traffic NN traffic light NN light crossing VVG cross over IN over Grant NP 19 1 Take VV take the DT the middle JJ middle lane NN lane following VVG follow signs NNS sign to TO 20 CC and 1 579 NP North NP North SENT Exit NN exit to TO to your PP your left VVN leave at IN at 21 Local Counsel NP Counsel to TO to debtor JJ debtor Sold NN assests NNS assest thereby RB thereby saving 22 S creditor successful JJ successful reorganization NN reorganization Medical NP Medical Malpractice NP 23 of IN of our PP our people NNS people SENT CLIENT NN client REPRESENTATION NP DESCRIPTION NP 24 S creditor successful JJ successful reorganization NN reorganization Brownsville NP Brownsville General NP Ge 25 diated VVD mediate a DT a medical JJ medical malpractice NN malpractice case NN case to TO to the DT the benefit Figura 5 7 Resultados da Minera o de Texto com Analisador Sint tico Fonte do autor da tese Bernstein NP Bernstein Pittsburgh NP Pittsburgh Law NP Law Firm NN frm When WRB when Joe NP Joe Bernstein NP Bernstein started VVD start his PPS his law NN law practice NN practice more JJR more than IN than 40 CD ca
38. precisa ser inventado Isto tem sido particularmente not vel no ltimo s culo do desenvolvimento de estruturas de indexa o ao desenvolvimento de hyperlinks Como toda motiva o para um empreendimento humano tamb m apresenta componentes de natureza pessoal outros dois trechos seminais de Bates 1999 p 1 049 contribu ram para o projeto desta tese algo no conceito de desafio multidisciplinar da Ci ncia da Informa o Em primeiro lugar importante se reconhecer que a ci ncia da informa o como a educa o e o jornalismo entre outros um campo que atravessa ou que ortogonal a as disciplinas acad micas convencionais a ci ncia da informa o tende a atrair pessoas multitalentosas pessoas que se comprazem da mistura de tipos de cogni o que a natureza do nosso campo exige 13 O n vel de investimentos em pesquisa e desenvolvimento nessa rea pode ser avaliado comparando o por exemplo com o tamanho do interesse da Microsoft pela aquisi o de uma empresa de portal de busca na Web como o Yahoo Gates da Microsoft explicou recentemente essa empreitada N s temos uma estrat gia para competir no espa o de busca que a Google atualmente domina que perseguiremos como temos feito antes de termos feito a oferta Yahoo e que podemos perseguir sem isso Envolve engenharia de ponta N s pensamos que a combina o com a Yahoo aceleraria as coisas de um modo muito excitante porque eles t m grandes eng
39. tica de cada palavra exemplos VB indica um verbo PP indica uma preposi o NP indica um substantivo nome e ADJ indica um adjetivo As tags acompanham as palavras no texto etiquetado geralmente colocado ao seu lado posterior como em corpora existentes em cada idioma 70 O desenvolvimento de m todos e t cnicas para implementa o do framework de indu o de hierarquias de conceitos de Cimiano 2006 tem duas correntes originais os m todos de recupera o da informa o para indexa o de termos baseado nas id ias de Salton e outros SALTON e BUCKLEY 1988 e as pesquisas em processamento da linguagem natural PLN Em suma a extra o de termos a partir de textos em linguagem natural implica o uso de n veis mais ou menos avan ados de processamento ling stico para identifica o de frases nominais complexas que podem expressar termos interessantes num contexto e an lise sint tica de depend ncia de termos para identifica o de suas estruturas internas Geralmente utiliza se softwares etiquetadores taggers de termos para identifica o de palavras quando dispon veis corpora de compara o adequados o Treetagger da Universidade de Stuttgart desenvolvido conceitualmente tamb m na Universidade da Pennsylvannia um exemplo ou se realiza etiqueta o manual de corpus aplicando depois algum m todo de reconhecimento de padr es sint ticos manualmente ou com uso de softwares de an lise sint tica
40. 6 5 pode se separar os que s o mais previs veis ou mais prov veis num contexto de neg cio de administra o de cart es de cr dito e temas correlatos e os que s o menos previs veis menos prov veis Obviamente os conceitos que se relacionam a Duop lio e Fronteira s o menos prov veis pois n o s o t picos desse nicho de mercado como Maquininha de Cart o Cart o de Cr dito e N mero de Transa es Com isso tem se mais surpresa e portanto informa o mais relevante para Intelig ncia Competitiva com Repercuss o do Fim do Duop lio no Setor de Cart es e Fronteira de Cart es que com os demais conceitos minerados nesse contexto A avalia o das probabilidades relativas de ocorr ncia de conceitos ou de valores de auto informa o SAYOOD 2000 em publica es de contextos de neg cios atribui o prec pua dos engenheiros do conhecimento que devem conhecer por dever de of cio os conceitos mais comuns que estruturam e caracterizam o nicho de neg cio da organiza o onde atuam Evidentemente com isso assume se que o engenheiro do conhecimento n o deve conhecer apenas m todos e tecnologias de minera o de conte dos mas tamb m em razo vel propor o tamb m os pr prios conte dos objetos do neg cio Essa abordagem a mesma dos antigos Analistas de Sistemas que precisavam conhecer os processos de neg cio da organiza o onde atuavam para modelagem
41. Coletou se p ginas dos portais em pelo menos tr s camadas desde a camada estruturante at a camada informativa para constitui o de arquivos consolidados com todos os conte dos de cada organiza o A opera o de acesso aos Web Portais e c pia dos conte dos se deu com uso do portal de buscas Google montando se arquivos de textos sem formata o codificados no padr o Unicode para redu o dos sinais de marca o HTML e outros indesejados de navega o figuras etc opera o realizada com o software de edi o de textos Microsoft Word Esta abordagem de coleta de dados brutos dos Web Portais Corporativos sem nenhum tipo de filtragem pr via teve como objetivo aproximar o experimento o m ximo poss vel das condi es de trabalho do mundo real com informa es e ru dos coexistindo nas fontes Com isso pretende se alcan ar maior robustez para opera o nas trincheiras da Intelig ncia Competitiva evitando se custosas e tediosas opera es de prepara o geralmente sele o e reformata o de textos para minera o encontradas em outras metodologias 113 O primeiro bloco de dados esquerda do quadro no APENSO I denominado Texto apresenta uma coluna com uma numera o das organiza es com portais pesquisados em ordem alfab tica outra coluna com o t tulo da colet nea se refere ao nome da organiza o mais conhecido e uma terceira coluna informa o tamanho de cada colet nea em bytes
42. Figura 6 16 encontram se tr s conceitos interessantes por n o serem triviais no mercado de TIC Collaboration with AIDS Researchers Research Platform for Sensor Networks e Goal for Heckerman s Research O primeiro conceito mencionado que de fato um conceito mais espec fico pois contem atributos do Modelo de Ambiente Externo partindo se da premissa que AIDS um tema de interesse geral da sociedade mundial integrado aos outros dois no modelo de informa o assumindo se que a classe Research tem um atributo denominado Researchers 8 AIDS Acquired Immunodeficiency Syndrome 177 Contexto Microsoft Research Collaboration Sensor Networks AIDS Researchers Heckerman s Research Research Platform Researchers Figura 6 16 Conceitos Integrados em Research gt Fonte do autor da tese De novo como os conceitos b sicos dos ambientes de TIC e de sa de n o t m conex es epistemol gicas auto evidentes causa certa surpresa a ocorr ncia de conceitos com objetos sintagm ticos interligando essas duas reas do conhecimento Assim pode se estabelecer maior valor relativo de auto informa o para esses conceitos multidisciplinares que para os conceitos mais fundamentais de cada um dos dois nichos de mercado Quando se utiliza os recursos do Google para recuperar conte dos com Microsoft Research e collaboration with AIDS researchers obt m apenas
43. Formal Concept Analysis foundations and applications Springer 2005 GERB Olivier Conceptual graphs for corporate knowledge repositories In LUKOSE Dickson DELUGACH Harry KEELER Mary SEARLE Leroy SOWA John Eds Conceptual Structures Fulfilling Peirce s Dream Proceedings of the Fifth International Conference on Conceptual Structures ICCS 97 Seattle Washington USA August 1997 p 474 488 GIGUETTE Ray Building objects out of Plato applying philosophy symbolism and analogy to software design Communications of the ACM v 49 n 10 p 66 71 out 2006 GILBERT Nigel Computer simulation of social processes Dispon vel em lt http www http sru soc surrey ac uk SRU6 html gt Acesso em 11 dez 2007 GODIN R GECSEI J PICHET C Design of browsing interface for information retrieval In BELKIN N J VAN RIJSBERGEN C J Eds Proceedings of the SIGIR 89 p 32 39 1989 GOMEZ P REZ A CORCHO O Ontology languages for the Semantic Web IEEE Intelligent Systems 2002 GON ALVES Jos Ernesto Lima As empresas s o grandes cole es de processos Revista de Administra o de Empresas v 40 n 1 jan mar 2000 p 6 19 GOOD J Speculations concerning Information Retrieval Research Report PC 78 IBM Research Centre Yorktown Heights New York 1958 GOTTSCHALG DUQUE Cl udio SiRILiCO Uma proposta para um sistema de recupera o de informa o baseado em teorias da Ling s
44. Gest o da Informa o e do Conhecimento como apresentada em Capuano et al 2009 O princ pio epistemol gico que se defende neste aspecto que a Intelig ncia Competitiva pode ser estruturada a priori como um macroprocesso corporativo conectado Gest o da Informa o e do Conhecimento motivo pelo qual esta tese aborda esses conceitos numa mesma Conforme Schreiber et al 2000 Engenharia do Conhecimento consiste na modelagem de diferentes aspectos do conhecimento humano abordagem metodol gica integrada nessa id ia de um construto de intelig ncia a partir de componentes mais b sicos de gest o da informa o aberta e dispon vel dos ambientes de neg cio que se apresenta as inova es propostas na tese Os conceitos de sistemas de neg cios e sistemas organizacionais adotados nesta tese s o abrangentes e intercambi veis referindo se aos modelos e sistemas de estruturas e processos decis rios e operacionais que moldam uma organiza o complexa contempor nea assim como aos objetos que constituem insumos e produtos nesses sistemas como os produtos e servi os oferecidos aos clientes e os pr prios sistemas de informa o computacionais SICs O problema geral para o qual se busca uma solu o o de transforma o semi autom tica do crescente volume de informa es das organiza es e sobre as organiza es em modelos conceituais que possam responder com efic cia e efici ncia s suas n
45. Gest o do Conhecimento para Intelig ncia Competitiva com base em informa es conceituais relevantes recuperadas de fontes digitais abertas e modeladas a priori das demandas dos usu rios com desempenho na revoca o de mais de 90 0 dos 2 5 de substantivos nomes mais frequentes A subtese consequente que contraria a vis o tradicional de subjetividade dos crit rios de relev ncia da informa o para o usu rio tamb m defens vel na medida em que se mostrou que a metodologia permite uma separa o formal de modo n o subjetivo do conjunto de conceitos mais relevantes num contexto de neg cios Esta metodologia representa um primeiro passo o da constru o de uma base epistemol gica para o desenvolvimento de uma solu o computacional de engenharia do conhecimento um framework para a modelagem de conceitos de neg cio em atividades de apoio ao desenvolvimento de estrat gias competitivas nas organiza es contempor neas A proposta metodol gica desenvolvida e testada para solu o do problema ainda que em escala experimental reduzida apresenta caracter sticas de uma solu o de engenharia como previsto por Bates 1999 p 1049 O posicionamento metodol gico fundamental da ci ncia da informa o pode ser descrito como sociot cnico As duas mais importantes tradi es metodol gicas que delineamos s o as ci ncias sociais e as ci ncias da engenharia para atuar 195 efetivamente na ci ncia da inf
46. Informa o que considera mais relevantes os termos mais frequentes no texto Considerando se eventos noticiados como os mais frequentes ou mais noticiados no texto na minera o de conceitos pode se utilizar a estat stica como recurso metodol gico E pode se tamb m observar na composi o de sintagmas com mais de um substantivo ou nome a presen a de termos que s o novidades no contexto como sugerido por Koch 1997 p 125 com grifos nossos Al m de ser uma forma de aprendizagem e de aprendizagem de l nguas em particular a repeti o constitui um meio de criar categorias itens novos desconhecidos podem ser agrupados em categorias ling sticas e culturais subjacentes ao lado de itens conhecidos familiares quando aparecem em frames repetidos no discurso Em outras palavras a repeti o permite assimilar o que novo 82 ao que j conhecido A obra de Choo 2003 constitui uma s ntese contempor nea sobre os processos de criac o de significado e constru o do conhecimento para tomada de decis o nas organiza es apoiada nos argumentos psicol gicos dos autores que o precederam inclusive Weick 1995 Ele argumenta que a cria o de significado provocada por uma mudan a no ambiente que produz descontinuidade no fluxo da experi ncia envolvendo as pessoas e atividades de uma organiza o CHOO 2008 p 21 O m rito de Choo 2003 se encontra na elabora o de um modelo mental que in
47. Intersection Computer Security Research Computer Science pese ko Figura 6 15 Conceitos Integrados em Systems e Computer Fonte do autor da tese Quanto ao conceito de conversion systems de acordo com os conte dos das p ginas recuperadas utilizando se o mesmo algoritmo no Google parece tratar se de uma linha de pesquisas mais antiga da Microsoft Research que desde o final dos anos 1990 investe no 176 desenvolvimento de sistemas para convers o de sinais e fonemas e para convers o de linguagens de textos O documento recuperado como o primeiro endere o URL um artigo publicado por cientistas da Microsoft Research sobre a tecnologia conhecida como OCR Optical Character Recognition indispens vel para digitalizac o de documentos produzidos com suporte em m dia papel Contudo resta saber se esses artigos de cientistas publicados na Web aberta n o significam que a Microsoft est abandonando essa linha de pesquisas como nos relatos e na l gica de intelig ncia apresentada por Fuld 2007 Com uma busca no Google para Microsoft Research and computing systems of the future apenas tr s enderecos s o recuperados sendo dois deles de p ginas do Web Portal da conhecida organiza o AAAI Association for Advancement of the Artificial Intelligence O conceito bastante gen rico referindo se a v rios objetos considerados como de sistemas computacionais do futuro essa percepc o reforcada com u
48. Michaud 2006b sugere uma abordagem conceitual de modelagem do conhecimento onde o conhecimento deve operar como um elo para se conectar o entendimento do passado com proje es de futuro muito conhecida na estat stica Essa abordagem de fato similar ao conceito de simulac o com base em modelos utilizados tanto nas ci ncias exatas como nas engenharias e nas ci ncias sociais LUNA REYES et a 2005 tamb m prevista no trabalho de 46 pesquisas em laborat rio proposto na tese Os pontos de sinergia cognitiva do presente projeto de pesquisa com as id ias de Michaud 2006b aparecem no respectivo artigo referenciado Muito foi escrito sobre dados informa es conhecimento e sua gest o modelos e modelagem E preciso instigar a reflex o sobre a rela o estreita e permanente dos conceitos de sistema modelo e conhecimento mostrando que um n o vive sem os outros MICHAUD 2006b p 211 Campos 2004 tamb m apresenta uma vis o sobre modeliza o de dom nios de conhecimento til no plano conceitual da metodologia proposta ainda que a autora revele no texto referenciado desconhecimento das metodologias de desenvolvimento de sistemas orientada a objetos OO e seus fundamentos te ricos Ela afirma que a classifica o de um dom nio n o cabe numa OO porque seus princ pios foram estabelecidos para tratar da modelagem de dados e n o de unidades de conhecimento chocando se nesse posicionamento conceitual com
49. X DX O appease o pem X O Dem RS O DR Cimiano 2006 p 57 58 define formalmente contexto formal e conceito formal do seguinte modo com uso de l gica e teoria dos conjuntos Defini o 1 Contexto Formal uma tupla G M I chamada um contexto formal se Ge M s o conjuntos e c G x M uma rela o bin ria entre Ge M Os elementos de G s o chamados objetos os de M atributos e a rela o de incid ncia do contexto Ent o para O c G define se O m M vg O gm E I E dualmente para A c M A gE G VME A gm E I O o conjunto de todos os atributos comuns aos objetos em O e A o conjunto de todos os objetos que tem todos os atributos em A Defini o 2 Conceito Formal um par O A um conceito formal de G M I se e somente se OcG AcM O Ae O A Ent o O denominado a extens o e A a intens o do conceito 39 Os s mbolos e opera es l gicas empregados t m o seguinte significado A c B A um subconjunto de B A lt B A um subgrupo de B A B A pertence a B v B para todo B A B equival ncia material entre A e B Como extens o extension entende se o conceito de instancia o ou representa o de um conceito com objetos do mundo O m todo adota esse termo com significado oposto ao de intens o intension com objetivo de relacionar e exemplificar os subconceitos de um conceito numa rvore de conceitos 39 Intensio
50. a defini o de objetos e id ias do mundo a partir de modelos de tipifica o Sowa 1984 argumenta que verbos como pensar conhecer e acreditar tomam senten as completas como seus objetos conectando se necessariamente a estruturas de gr ficos nos nodos de outros gr ficos e que um dos verbos mais importantes nesse sentido definir na medida em que uma defini o pode envolver um gr fico inteiro como um nome coisa ou um r tulo de tipo O autor explica que Defini es podem especificar um tipo de dois modos estabelecendo condi es necess rias e suficientes para o tipo ou apresentando uns poucos exemplos e afirmando que tudo que for similar a esses exemplos pertencem ao tipo O primeiro m todo deriva do m todo de defini o de Arist teles mediante genus e differentiae e o segundo mais pr ximo de Wittgenstein 1953 SOWA 1984 p 104 Sowa 1984 menciona alguns artefatos computacionais desenvolvidos para o tratamento dessas duas abordagens de defini o como construtos de Intelig ncia Artificial E ressalta tamb m que Gr ficos Conceituais suportam tanto defini es de tipos por generaliza o e diferencia o como esquemas e prot tipos que especificam conjuntos ou fam lias de estruturas conceituais Esses m todos s o baseados na no o de abstra o dos Gr ficos Conceituais que s o gr ficos can nicos com um ou mais conceitos designados como par metros
51. admitamos que inclusive os mecanismos de busca de pessoas udio e v deo poder o ser utilizados como recursos de fonte tais como o Facebook as redes sociais e outros para assim incluir a Informa o de Conhecimento T cito como uma intens o do conceito Web no reticulado Entao lendo se o reticulado de baixo para cima dos objetos mais especificos para os mais gen ricos em termos de informa o tem se a impress o de acordo com o m todo da An lise de Conceito Formal que congressos peri dicos e programas de r dio e TV est o no mesmo n vel de especializa o talvez com base no conceito de not cia situando se num n vel mais gen rico ainda as publica es governamentais a intercomunica o pessoal e a informa o do conhecimento t cito E que no topo do reticulado os arquivos p blicos os livros e volumes consolidados seriam as fontes mais gen ricas de todas Contudo isso representaria um paradoxo da An lise de Conceito Formal se n o consider ssemos a leitura correta dessa rvore de conceitos Como os conceitos no caso ser o t o mais gen ricos quanto as fontes de informa o que s o seus objetos instanciados forem mais teis servindo a v rias metodologias de elabora o de Intelig ncia Competitiva intuitivamente a Web deve ser a fonte mais inclusiva em termos dessas fun es portanto a mais gen rica e os arquivos p blicos livros e volumes consolidados as fontes mais espec f
52. ambientes competitivos Observa se no caso que o conte do resultante da busca no Google cont m dicas importantes sobre linhas de neg cios em expans o na organiza o e mais importante ainda uma revela o sobre o que essa organiza o pensa acerca desse mercado Servi os de sa de representam uma das oportunidades de neg cios com TIC com crescimento mais r pido no mundo desenvolvido e em desenvolvimento Este trecho representa de modo auto evidente para 165 os conhecedores do mercado informa o relevante para desencadear o est gio de constru o do conhecimento no contexto O modelo conceitual da Figura 6 12 portanto apresenta dois conceitos relativamente pouco prov veis em textos sobre organiza es do neg cio de TIC no mercado Healthcare Delivery and Tracking Systems e Healthcare Systems Estes s o os conceitos mais perturbadores nesse tipo de ambiente de informa es porque para se compreender o sentido significado desses conceitos e associar a eles alguma id ia de neg cio ser necess rio um processo de constru o de conhecimento que poder ser apoiado na minera o recursiva Os demais conceitos da Figura 6 12 referindo se a objetos mais conhecidos no contexto de mercado de TIC provavelmente produzir o menos impacto psicol gico no sistema cognitivo do engenheiro do conhecimento Outro aspecto interessante no texto sobre o pesquisador da IBM Research se refere s suas credencia
53. an innovative scientific methodology that integrated techniques from ethnography psychology psychometrics and advanced statistics Unlike traditional predictive marketing models the new IBM model targets cause and effect relationships rather than correlations Examining more than 1 500 variables reflecting every aspect of the retailer s customer experience including location advertising salespeople and pricing the model calculated the ability of each one to boost sales and zeroed in on ten top success factors By applying the results to a series of new marketing strategies the retailer boosted sales and was even able to double sales in one product category In addition to removing much of the guesswork in designing marketing campaigns the model also provided side benefits including insight into consumers mental models that helped the client understand its target audience product positioning and whether up selling strategies were likely to be successful Customer lifetime value management Cross channel marketing via lifetime value modeling enables a retailer to leverage the full potential value of its existing customer base to drive long term profits across all of its contact points When Saks Fifth Avenue sought to optimize its cross channel marketing it turned to IBM Research IBM Global Business Services which developed a novel methodology to help track a customer s response on one channel as a result of contact on another and
54. ao m todo de An lise de Conceito Formal e que o torna generaliz vel A leitura da Figura 3 1 deve ser executada da seguinte maneira o objeto Garfield tem os atributos de ser um gato e ser um desenho atributos estes que s o comuns tamb m aos animais com o atributo de mam fero por isso os n s dos atributos desenho e gato no reticulado s o ligados ao n do atributo mam fero logo acima o objeto Snoopy tem os atributos c o e desenho sendo que ambos atributos s o comuns tamb m aos animais com o atributo mam fero Socks tem o atributo gato que implica ser um mam fero mas tem tamb m o atributo de ser um animal do mundo real situa o similar ocorre com o objeto Greyfriar s Bobby que tem o atributo c o e por consequ ncia mam fero mas que tamb m real Com Harriet ocorre que ela tem apenas dois atributos ver Tabela 3 2 ser uma tartaruga e ser real importante ressaltar se que os n s da Figura 3 1 representam por si mesmos conceitos formais e que para um contexto formal os conceitos formais suas extens es e intens es s o 42 definidas de modo nico e fixo PRISS 2005 A Figura 3 2 mostra como funciona o modelo da rela o entre um subconceito e um superconceito na An lise de Conceito Formal intens o real extens o Harriet Bobby Socks intens o real mam fero extens o Bobby Socks Figura 3 2
55. capacidade de processamento de textos em linguagem natural plain texts para produ o de listas e estat sticas de frequ ncia de palavras busca textual com palavra chave busca de segmentos de textos com base em padr es sint ticos predefinidos implementando a fun o concordance ou com base em horizontes de posicionamento de termos cont guos ou n o nas senten as fun o collocation descoberta de agrupamentos clusters mais frequentes de palavras descoberta de padr es de combina o de conjuntos de palavras predefinidas concgram e outros recursos de PLN Os dados processados resultantes podem ser obtidos tanto com a interface gr fica do aplicativo como em formato de planilha eletr nica O ToscanaJ representa uma evolu o em linguagem de programa o Java de uma conhecida plataforma computacional para An lise de Conceito Formal originalmente desenvolvida em linguagem C utilizada na academia As interfaces de entrada de dados s o tamb m bastante limitadas com pouca usabilidade mas permitem a elabora o de contextos com milhares de objetos de entrada e atributos Contudo os reticulados lattice produzidos se tornam pouco teis quando os contextos apresentam um n mero relativamente elevado de atributos os experimentos de laborat rio mostraram que para mais de uma dezena de atributos em contextos com centenas de objetos o n mero de conex es de conceitos pode ser elevado o bastante para tornar sua leitura e interpre
56. cio ainda que n o em tanta profundidade como os operadores do neg cio 196 desse recurso e a possibilidade de ampliac o de seu uso no contexto postando se neste ponto solidariamente ao apelo de Bates 1999 no sentido de se evitar a irrefletida rejei o tecnol gica dos Ludditas na Ci ncia da Informa o e os modelos ontol gicos propostos podem ser teis na composi o de um ambiente de aprendizagem a partir de informa o textual coletada de fontes digitais abertas numa linha de atividades de Gest o do Conhecimento para apoio ao desenvolvimento de Intelig ncia Competitiva nas organiza es como mencionado na introdu o a esta tese adota se uma percep o de gest o do conhecimento por meios indiretos com base na informa o adequadamente representada para o aprendizado individual e os modelos conceituais resultantes s o expressos em linguagem natural sendo portanto acess veis aos v rios tipos de p blicos com perfis sociot cnicos bastante diversos que geralmente comp em uma organiza o de porte embora a representa o da informa o n o deva na Ci ncia da Informa o ser confundida com o conhecimento do conte do da informa o BATES 1999 os modelos conceituais propostos como se mostrou no Cap tulo 6 permitem o desenvolvimento de insights nos usu rios a partir do acesso direto a conceitos do neg cio e embora testada apenas com informa es da Web a metodologia proposta bastante
57. comum a carro e bicicleta rideable encontr vel apenas em bicicleta e joinable como atributo de excurs o e viagem O pr ximo passo do m todo em rela o ao contexto formal representado na Tabela 3 1 seria a descoberta de conjuntos fechados entre si que s o obtidos com um conjunto de objetos O e um conjunto de atributos A quando os atributos em A s o exatamente os mesmos que s o comuns a todos os objetos em O e vice versa todos os objetos em O s o exatamente os mesmos que t m todos os atributos em A Os exemplos de objetos que representam conjuntos fechados na Tabela 3 1 s o excurs o e viagem excurs o viagem pois ambos t m os mesmos atributos reserva e ades o reserva ades o e vice versa Considerando se ent o que os contextos formais s o dados estruturados em unidades que representam abstra es formais de conceitos do pensamento humano com interpreta o compreensiva e significativa An lise de Conceito Formal uma t cnica de clusteriza o conceitual que tamb m prov descri es gen ricas para os conceitos abstratos ou unidades de dados produzidos no m todo Formal Concept Analysis FCA no original Optou se pelo uso de termos atributos interpretados para o idioma portugu s pela dificuldade e desconforto ling stico na tradu o de termos como driveable rideable e joinable no original 38 Tabela 3 1 Dom nio Turismo como Contexto Formal qe fx O Ese ee ee
58. conceitos que v em a seguir na metodologia 116 ove NN move into IN into the DT the right JJ right lane NN lane and CC and follow VV follow the DT the Veteran N owards IN towards Pittsburgh NP Pittsburgh SENT Exit NN exit at IN at the DT the Boulevard NP Boulevard of IN of IN of the DT the Allies NP SENT Move NN move into IN into the DT the right JJ right lane NN I is VBZ be located VVN locate at IN at the DT the corner NN corner of IN of Grant NP Grant and CC and Seventh NP toward IN toward Pittsburgh NP Pittsburgh SENT Exit NN exit at IN at the DT the Veterans NPS Veterans Bridge through IN through the DT the traffic NN traffic light NN light crossing VVG cross over IN over Grant NP 9 P North NP North signs NNS sign SENT Exit NN exit to TO to your PP your left VVN leave at IN at 10 raight RB straight through IN through the DT the traffic NN traffic light NN light crossing VVG cross over 11 is VBZ be located VVN locate at IN at the DT the corner NN corner of IN of Grant NP Grant and CC and Seventh NP 12 ffic NN traffic light NN light turn NN turn right NN right passing VVG pass the DT the Convention NP 13 the DT the Omni NP Omni Hotel NP Hotel SENT Drive NN drive across IN across Liberty NP Liberty Avenue NP Av 14 at the DT the second JJ second traffic NN traffic light NN light turn NN turn right NN right passin 15 JJ second traffic NN traffic light NN light turn NN turn right NN right
59. constituem as maiores unidades mentais dos seres humanos como os pensamentos tornando os centrais em nossa exist ncia do ponto de vista cognitivo Este termo utilizado por Bates 1999 se refere s aplica es concretas e tang veis da Ci ncia da Informa o que ocorrem nas organiza es 19 3 REVIS O DE LITERATURA Considerando tratar se de um tema multidisciplinar que integra v rias reas cl ssicas do conhecimento cient fico como Lingu stica Filosofia Matem tica Psicologia Administra o e Ci ncia da Computa o num construto de Recupera o Conceitual da Informa o com uso de recursos da Intelig ncia Artificial IA a literatura dispon vel vasta e din mica com um volume expressivo de novas e importantes contribui es publicadas a cada dia A revis o apresentada a seguir uma fra o suficiente desse universo e bastante atual at porque o conhecimento basilar de m todos e t cnicas para automa o dos processos de Recupera o da Informa o RI desenvolvido na segunda metade do S culo XX continua sendo til nos novos contextos de reposit rios digitais da Web Os conte dos recuperados para estudo nesta tese no entanto constituem um conjunto conceitualmente coeso buscando se integrar esse conhecimento fragmentado numa nova s ntese em Ci ncia da Informa o 3 1 Hist rico epistemol gico 3 1 1 Origens na Ci ncia da Informa o O tema da pesquisa algo conceitualmente
60. da organiza o com o desenvolvimento de sistemas nas reas sugeridas pelos objetos da ontologia mais superficial warning system for automobiles e health delivery and tracking systems Como o mercado de autom veis no mundo imenso pode se inferir que a IBM est buscando tamb m como a Microsoft um mercado de escala mundial para seus novos produtos tecnol gicos E que do mesmo modo que a Microsoft est de olho no mercado de servi os de sa de com uma escala natural em n vel global Essas conjecturas ainda que preliminares mostram que pode haver competi o entre IBM e Microsoft pelo mercado de tecnologias de suporte aos servi os de sa de em n vel global Quanto Fujitsu Research seu alvo de pesquisa e desenvolvimento parece concentrar se na agrega o de valor na gest o de servi os de transporte de bens f sicos declarado nos objetos de ontologia superficial transportation and delivery plans e value in service innovations Esse nicho de mercado de TIC n o coincide aparentemente com os nichos onde atuam ou pretendem atuar IBM e Microsoft e isso pode ser uma estrat gia da Fujitsu Corporation Com essa an lise preliminar dos tr s contextos e seus conceitos minerados conclui se que a organiza o Fujitsu Research est voltada para um mercado de nicho visado por sua holding enquanto IBM Research e Microsoft Research est o atuando em dois tipos de frentes sendo uma aparentemente competitiva co
61. de Animais Famosos 42 Figura 3 2 Rela o Subconceito Superconceito 43 Figura 3 3 Exemplo de Modelo de Dados Entidade Relacionamento 50 Figura 3 4 Exemplo de Gr fico Conceitual Representando uma Senten a 54 Figura 3 5 Generaliza o com Gr ficos Conceituais 55 Figura 3 6 Representa o de Rela es na UML 59 Figura 3 7 Generaliza o entre Classes 60 Figura 3 8 Relacionamentos Estruturais 61 Figura 3 9 Atributo como Associa o ou Nota o 62 Figura 3 10 Exemplo de Reposit rio na UML 63 Figura 3 11 Modelo de Atividade na UML 64 Figura 3 12 Tri ngulo de Significados de Sowa 66 Figura 3 13 Camadas de Aprendizado Ontol gico 67 Figura 3 14 Processo de Indu o de Hierarquia de Conceitos 69 Figura 4 1 Defini o de Tipo para BEIJO 88 Figura 4 2 Simula o como M todo Experimental 90 Figura 4 3 Fluxo L gico da Pesquisa 91 Figura 5 1 Poder Sem ntico dos Sintagmas Plurinominais 96 Figura 5 2 Pilha de Conceitos 98 Figura 5 3 Cen rio Evolutivo da Web 104 Figura 5 4 Classifica o Evolutiva dos Web Portais 106 Figura 5 5 Camadas de Conte dos em Web Portais Corporativos 112 Figura 5 6 Processo Experimental Parte I 115 Figura 5 7 Resultados da Minera o de Texto com Analisador Sint tico 117 Figura 5 8 Exemplo de Resultado da Etiquetagem 117 Figura 5 9 Processo Experimental Parte Il 125 Fig
62. de ordem pr tica como integrar os conceitos minerados e com atributos classificados no modelo CommonKADS Modificado conforme os APENSOS III A III B e III C a um modelo de uso em Intelig ncia Competitiva Como resposta a Tabela 6 1 e a Figura 6 1 apresentam respectivamente uma proposta de classifica o dos conceitos obtidos na An lise de Conceito Formal com base nas cinco for as de Porter 1980 em contextos de Intelig ncia Competitiva e o reticulado de conceitos correlato Os conceitos agrupados em Estruturas Corporativas Processos Produtivos Concorrentes For as do Mercado e Outros s o ent o considerados os objetos de an lise e as for as de Porter onde os conceitos se encaixam pela sua utilidade s o considerados os respectivos atributos desses objetos buscando se correla es entre os conceitos e sua utilidade no modelo anal tico de Porter 142 Com isso sugere se que os conceitos formais compostos por objetos sintagm ticos envolvendo a pr pria organizac o que realiza o estudo assim como outros objetos relativos a formas de organiza o em geral como a pr pria Web com ou sem outros atributos do modelo CommonKADS Modificado se referem a organiza es de jogadores ou players no mercado assim como a seus clientes e parceiros Como exemplos de objetos sintagm ticos que integram essa classifica o conforme os conte dos do APENSO III A APENSO III B e APENSO III C reuni
63. de organiza o modelo de tarefa e modelo de agente Entretanto considerando se que a Intelig ncia Competitiva ser sempre voltada para o ambiente externo ainda que com as for as internas da organiza o acrescentou se inicialmente mais uma categoria para o experimento denominada modelo de ambiente externo O primeiro experimento de categoriza o se deu com os objetos sintagm ticos extra dos da colet nea da organiza o IBM Research APENSO III B com resultados ainda um tanto insatisfat rios em termos de velocidade do procedimento de classifica o manual O gargalo de classifica o apareceu em se deparando com objetos intuitivamente pouco caracteriz veis como correlatos aos modelos adotados tais como accuracy of the solution advances in information technology analytics capabilities bandwith availability BlueStar technology cell phone crisis situations holiday seasons level of complexity performance factors project experience e outros Esse tipo de percep o tamb m se fez sentir na classifica o dos objetos sintagm ticos de outras duas organiza es selecionadas para essa experi ncia preliminar Fujitsu Research e Microsoft Research 129 Com isso buscou se um reestudo do modelo de categorizac o de objetos de contexto do m todo CommonKADS antes de se prosseguir nos experimentos Ent o analisando se a natureza dos objetos que
64. de sistemas de informa o computacional para automa o desses processos Ent o no exemplo o engenheiro do conhecimento atuando numa organiza o no mercado de administra o de cart es de cr dito tendo seu sistema cognitivo perturbado com esses conceitos diferentes pouco prov veis que aparecem na minera o inicia um processo de cria o de significado que ao final poder lhe proporcionar insights para constru o de conhecimento e tomada de decis o CHOO 2003 Os exemplos a seguir destacados do experimento com informa es conceituais mineradas dos Web Portais de tr s empresas do mercado mundial de TIC ser o os pr ximos contextos de an lise conceitual discutidos 6 1 2 Contextos e conceitos comparados 6 1 2 1 Diamantes de conceitos Examinando se num primeiro momento as rela es entre os conceitos minerados em cada contexto organizacional Fujitsu Research IBM Research e Microsoft Research amostrado no experimento e depois comparando os pode se avaliar a utilidade da informa o recuperada e 153 filtrada com o m todo proposto num ambiente de Gest o da Informa o e do Conhecimento para suporte pr tica da Intelig ncia Competitiva Os reticulados de conceitos desses tr s contextos que lembram a estrutura molecular de um diamante s o apresentados nas Figuras 6 6 6 7 e 6 8 mostrando se apenas as quantidades de objetos que comp em cada conceito formal nos cruzamentos de algumas linhas
65. do conceito de Delivery Services nos neg cios da empresa evidenciado na Figura 6 10 We formulate transportation and delivery plan as well as hub and location plans in consideration of all the issues involved in the form of mathematical models and investigate and apply the requisite Technologies for their optimization Quanto ao segundo endereco da resposta do Google http jp fujitsu com group fri en economic publications report 2007 report 289 html o conte do o resumo de um relat rio com um t tulo bastante revelador que mostra as fraquezas gerenciais das empresas japonesas operando na China Problems and Solutions for Management of Japanese Companies in China Esse resumo fala por si numa extens o alarmante de um ponto de vista competitivo de abertura e conquista de mercado ABSTRACT 1 Following the rapid growth of the Chinese economy Japanese companies are aggressively expanding operations in China These companies however are saddled with various management problems These problems are related to Japanese company systems and Japanese style management 2 Concerning the management of personnel and labor when Japanese systems are introduced directly they do not fit with the circumstances in China and incentives for employees become deficient Delays in the localization of personnel cast a shadow on various areas such as management costs procurement sales and etc 3 High costs are also hindering Japanese companies
66. do conhecimento para suporte ao desenvolvimento de intelig ncia competitiva nas organiza es O tema conceitual atual e Choo 2007 o aborda do ponto de vista dos aspectos epistemol gicos inerentes recupera o de informa o em ambientes organizacionais num texto bastante recente Brachman e McGuinness 1988 tamb m ilustram como conectar os conceitos de conexionismo relativo s redes neurais como instrumento t cnico para recupera o conceitual de informa es em contextos de gest o do conhecimento id ia alinhada com o desenvolvimento de ferramentas tecnol gicas para apoiar processos de intelig ncia competitiva nas organiza es 93 5 DADOS EXPERIMENTOS E RESULTADOS Carnudos substantivos verbos esguios LISPECTOR 1998 Com este cap tulo s o apresentados os dados utilizados na pesquisa os experimentos de laborat rio executados e os resultados observados do ponto de vista da minera o conceitual da informa o Entretanto como comentado na introdu o a esta tese defende se que o modelo padr o de apresenta o de um texto de tese desta natureza deve ser flexibilizado para que n o se caia na tenta o de tentar condensar todos os conte dos cient ficos de base que abrangem v rias disciplinas em v rios n veis de profundidade e utilidade antes de sua contextualiza o emp rica Caso os coment rios mais especializados de contextos de Intelig ncia Competitiva fossem inseridos nos cap tul
67. e v deo de modo a suportar processos de extra o representa o e mapeamento da informa o e inspirar a gera o do conhecimento individual em um determinado dom nio ontol gico Belew 1987 p 1 por exemplo cita met foras de um magistrado do in cio do S culo XX para ilustrar numa linguagem algo po tica a inerente complexidade epistemol gica do tema uma palavra n o um cristal transparente e imut vel mas a pele de um pensamento vivo Juiz Chefe Holmes Towne v Eisner 191 Evolutivamente a terminologia dos pesquisadores que se ocupam de problemas de Ri incorporou a express o recupera o conceitual de informa o RCI para destacar os aspectos mais essenciais relativos a conte dos extra dos das fontes de informa o Belew 1987 justifica qualquer esfor o de pesquisas nessa dire o argumentando que existe muito a melhorar na capacidade de recupera o de informa es relevantes nos sistemas de recupera o de informa o SRI baseados nas metodologias e tecnologias tradicionalmente utilizadas emprestadas da estat stica da l gica e da matem tica e ressalta as poss veis contribui es do campo multidisciplinar da IA para tanto Os m todos tradicionais de RI com uso de t cnicas estat sticas e l gico matem ticas s o reconhecidamente limitados para a miss o de extra o de conhecimento de textos em linguagem natural BELEW 1987 o que tem motivado pesquisas com
68. em processos din micos dentro de ambientes sociais e culturais A tradi o filos fica dominante define que um conceito constitu do por sua extens o abrangendo todos os objetos que pertencem ao conceito e sua intens o incluindo todos os atributos propriedades e significados que se aplicam a todos os objetos da extens o Outra no o epistemol gica basilar que conceitos somente podem se apresentar relacionados a outros conceitos onde a rela o entre superconceitos e subconceitos exerce um importante papel especialmente nas metodologias de classifica es de seres e objetos no mundo O subconceito de um superconceito um conceito cuja extens o est contida na extens o do superconceito e cuja intens o cont m a intens o do superconceito 3 Como n o h tradu o para o termo intension do idioma original adotou se o neologismo intens o como uma refer ncia til no contexto 37 O fil sofo Arist teles em sua no o de diferencia o differentiae estabeleceu o fundamento l gico do m todo de An lise de Conceito Formal ACF ao observar que existe uma conex o inversa entre quantidades de objetos e quantidades de atributos pois quanto mais caracter sticas se requerem de um objeto menos inst ncias dessa classe de objetos ser o encontradas no mundo e vice versa ou seja quanto menos caracter sticas se requerem de um objeto mais inst ncias desse objeto gen rico ser o en
69. formais Observa se na Figura 4 1 um exemplo de Gr fico Conceitual representando a defini o do tipo conhecido em linguagem natural como beijo SOWA 1984 p 106 A leitura desse gr fico em linguagem natural como exercitado anteriormente o tipo BEIJO gen rico consiste num tipo espec fico de TOQUE executado por um agente AGNT denominado PESSOA que tem como parte PART constituinte L BIOS onde esse TOQUE executado de maneira MODO SUAVE com o instrumento INST L BIOS 87 tipo BEIJO x Figura 4 1 Defini o de Tipo para BEIJO Fonte SOWA 1984 Outros tipos can nicos s o ilustrados por Sowa 1984 demonstrando o poder de resoluc o sem ntica dos Gr ficos Conceituais com estruturas de objetos e rela es constru das para representa o de abstra es Esse tipo de recurso til para representa o de conceitos com referentes mais dif ceis de se encontrar em objetos concretos como o caso da defini o de servi o Os Gr ficos Conceituais tamb m apresentam recursos importantes para a generaliza o especifica o agrega o e individualiza o de conceitos fundamentais para a teoriza o cient fica motivos pelos quais foram adotados na metodologia Os Gr ficos Conceituais no entanto ser o utilizados com parcim nia na metodologia de minera o e modelagem de conceitos propostas nesta tese com aplica o em situa es especiais onde se necessita detalhar com predi
70. http www isoco org pdf Semantic Wave 2008 Executive summary pdf Acesso em 11 abr 2010 205 DAVYDOV Mark M Corporate portals and e business integration McGraw Hill 2001 DE VILLE Barry Microsoft data mining integrated business intelligence for e commerce and knowledge management Digital Press 2001 DELBECQUE Nicole A lingu stica cognitiva compreender como funciona a linguagem Tradu o de Fernanda Oliveira Lisboa Instituto Piaget 2008 DIETZ Jan L G The deep structure of business process Communications of the ACM v 49 n 5 p 59 64 maio 2006 DING Yihong XU Li Evolution of the World Wide Web part 2 Web evolution theory and the next stage Dispon vel em http www deg byu edu ding WebEvolution evolution dream html Acesso em 11 abr 2010 DOSZKOCS Tamas E Natural Language Processing in Information Retrieval Journal of the American Society for Information Science v 37 n 4 p 191 196 jul 1986 DOYLE L B Is automatic classification a reasonable application of statistical analysis of text Journal of the ACM n 12 p 473 489 1965 EBECKEN Nelson Francisco Favilla LOPES Maria Celia Santos COSTA Myrian Christina de Arag o Minera o de textos In REZENDE Solange Oliveira Org Sistemas Inteligentes fundamentos e aplica es Barueri S o Paulo Manole 2005 p 337 375 EKLUND Peter W ELLIS Gerard MANN Graham Eds Conceptual structures knowledge represent
71. imaginar se uma linguagem significa imaginar se uma forma de vida Mas o que dizer sobre isto o pedido de Tijolo no exemplo 2 uma senten a ou uma palavra Se uma palavra certamente n o tem o mesmo significado da palavra de som parecido de nossa linguagem ordin ria Mas se uma senten a n o certamente a senten a el ptica Tijolo de nossa linguagem Porque se voc grita Tijolo voc realmente quer dizer Apanhe um tijolo para mim Outra passagem de outra obra da filosofia aristot lica esclarece ainda mais acerca dos prop sitos desse modelo de categorias ARIST TELES 1969 p 13 14 A subst ncia anterior para o conhecimento Conhecemos melhor uma coisa quando sabemos o que ela do que quando estamos informados de sua qualidade quantidade e lugar E com efeito se queremos conhecer alguma coisa pertencente a uma categoria que n o a de subst ncia n o devemos indagar das qualidades etc que possui mas sim do que ela qual a sua quase subst ncia o que faz com que ela seja o que Neste contexto evidente que a subst ncia n o est sendo concebida como a coisa concreta mas como a natureza essencial E esse duplo significado impregna todo o tratamento da subst ncia por Arist teles Esta ltima passagem interessante porque mostra tamb m a preocupa o do fil sofo em esclarecer o papel do conceito de subst ncia na epistemologia das coisas do mundo O
72. in Information Science In CRONIN Blaise Ed Annual Review of Information Science and Tecnology ASIST v 40 2005 PULIER Eric TAYLOR Hugh Compreendendo SOA corporativa Tradu o de Marcelo Trannin Machado Rio de Janeiro Ci ncia Moderna 2008 QUILLIAN M Ross Semantic memory PhD Dissertation Carnegie Mellon University Pittsburgh 1968 QUONIAM Luc Competitive Intelligence 2 0 Bras lia Apresenta o na Faculdade de Ci ncia da Informa o da Universidade de Bras lia FCI UnB 5 mar 2010 REINBERGER M L SPYNS P Discovering knowledge in texts for the learning of dogma inspired ontologies In BUITELAAR P HANDSCHUH S MAGNINI B Eds Proceedings of the ECAI Workshop on Ontology Learning and Population 2004 p 19 24 RICHARD Mark Ed Meaning Blackwell 2003 RITTO Antonio Carlos Organiza es ca rdicas modelagem de organiza es inovadoras Rio de Janeiro Ci ncia Moderna 2005 ROBERTS D D The Existential Graphs of Charles Sanders Peirce Mouton The Hague Netherlands 1973 ROBREDO Jaime Planejamento e ger ncia de sistemas deilnforma o sob o ngulo da gest o por processos Revista de Biblioteconomia de Bras lia v 23 24 n 4 1999 2000 Edi o Especial ROSE Daniel E BELEW Richard K Legal information retrieval a hybrid approach Association for Computing Machinery 1989 SALTON G Automatic text analysis Science n 168 p 335 343 1970 SALTON G
73. knowledge useful for Competitive Intelligence The experiment shows statistically that the methodology gives a very satisfactory performance with recall of at least 90 of a number of nouns present in most relevant repositories of digital texts on organizations COMPETITIVE INTELLIGENCE CONCEPT MINING CONCEPT MODELLING KNOWLEDGE ENGINEERING ARTIFICIAL INTELLIGENCE SUM RIO AGRADECIMENTOS RESUMO i ABSTRACT ii SUM RIO iii RELA O DE ABREVIATURAS E SIGLAS vii RELA O DE TABELAS x RELA O DE GR FICOS xi RELA O DE QUADROS xii RELA O DE FIGURAS xiii 1 INTRODU O 1 1 1 Competitividade e Sistemas de Neg cios 1 1 2 Gest o da Informa o e do Conhecimento 4 1 3 Minera o Conceitual de Informa es 6 1 4 Modelos como Sensores Sem nticos 9 1 5 Justificativa 10 1 5 1 Motiva o 10 1 5 2 Oportunidade 14 2 PROBLEMA TESE OBJETIVOS E RELEV NCIA DA PESQUISA 15 2 1 Problema Geral 15 2 2 Tese Objetivos Gerais e Espec ficos 16 2 2 1 Tese 16 2 2 2 Objetivo Geral 17 2 2 3 Objetivos Espec ficos 17 2 3 Premissa e Hip tese 18 2 4 Relev ncia da Pesquisa 18 3 REVIS O DE LITERATURA 20 3 1 Hist rico Epistemol gico 20 3 1 1 Origens na Ci ncia da Informa o 20 3 1 2 Cen rio Sociot cnico Multidisciplinar 23 3 2 Contextos e Conceitos 24 3 2 1 Intelig ncia Competitiva nas Organiza es 24 3 2 2 Recupera o da Informa o 28 3 2 3 Processamento da Lingu
74. linguagem natural os gr ficos conceituais podem servir de linguagem intermedi ria para tradu o de formalismos computacionais para e de linguagens naturais Com sua representa o gr fica eles podem servir de linguagem imediatamente leg vel mas tamb m como uma linguagem formal de projeto e especifica o Outro aspecto interessante do GC como ferramenta anal tica de processamento sint tico e sem ntico da informa o textual sua capacidade de suportar racioc nios com conjuntos de conceitos Cao e Creasy 1997 p 416 comentam sobre esse recurso que dados dois GCs 55 pode se determinar se um subsume o outro por uma projec o de GC executada diretamente nos dois GCs proje o e ajuntamento s o duas opera es de GCs Aplica es de GCs t m se multiplicado em v rias reas e dom nios do conhecimento desde sua cria o nos anos 1980 com entusiasmo crescente na ltima d cada Lukose et al 1997 comentam a prop sito que tais esfor os t m se expandido em reas como processamento da linguagem natural aquisi o de conhecimento recupera o da informa o e fundamentos filos ficos da l gica Gerb 1997 apresenta um formalismo gr fico para representa o da mem ria corporativa baseado em GCs algo parecido com os elementos primitivos da UML Eklund Ellis e Mann 1996 publicaram tal como Lukose et al 1997 uma colet nea de artigos inclusive com aplica es organizacionais e aplicativos de soft
75. maiores que as encontradas na maioria dos microcomputadores pessoais 157 ZIN Modelo de Insumo e Produto LN accuracy of the soluction advent of technologies te M in information techno Modelo de Ambiente Extemo Modelo de Agente Center for Business Optimization CBO L IBM Research IBM Research Computational Center consultant and solution leader data brokers dealer service records Ad NIS SO St ys OTAN husinass nnaratinn AMI in emen RE abstraction for the business artifacts gie and demand side DR allience between business technology researc business networks S appreciation of the business opportunity bankin business applications a 25 more chemig consultants from IBM 2 Bayer HealthCare Research PI haa China Research Lab zamon applications T H ammunications Indian Institute of Technology s business professionals bs 2more enterprise clients business computing team groups of researchers and scientists cross industry Supply Chain Operations Reference Model industr clients Amore gement CELM use U more business services clients collaboration between supply chain partners supply chain partners v alliance between technologists knowledge management experts and business professionals Web browsing technology match for his interest in supply chain simulation 6 more 5 more business development process business expan
76. modelos para as fontes originais de informa o minerada de modo a obter detalhes ampliados desses conceitos Ou ainda buscando informa es complementares em outras fontes digitais fora do Web Portal da organiza o analisada Minera o de Conceitos Elabora o de Modelos An lise Ontol gica Figura 6 18 Ciclo de Modelagem Conceitual Recursiva Fonte do autor da tese Os objetos sintagm ticos resultantes da nova minera o de conceitos poder o tamb m serem dispostos em contextos para aplica o do m todo da An lise de Conceito Formal Os atributos tamb m poder o ser outros ao inv s dos atributos baseados no modelo CommonKADS de modo a mostrar agrupamentos de objetos com outra finalidade Como exemplo pode se empreender nova minera o conceitual tendo como conceito central Warning System for Automobiles de modo a se obter informa es mais detalhadas acerca dos produtos existentes nesse mercado seus fabricantes e respectivas aplica es espec ficas em ve culos alarme contra furto alarme de temperatura do motor alarme de problemas mec nicos alarme de condi es de tr fego etc Os objetos no exemplo poder o ser os produtos com indica o dos fabricantes e os atributos as aplica es obtendo se nos clusters conceituais as subdivis es desse nicho de mercado com os respectivos produtos tecnol gicos dispon veis ver modelo gen rico ilustrativo na Tabela 6 2 e na Figur
77. numa determinada regi o relativa ao fen meno em estudo onde se encontram os sensores que captam os dados e de um n central onde se concentra o poder computacional de processamento dos dados para posterior an lise por especialistas tem ticos Os dados capturados nos n s s o transmitidos automaticamente geralmente por redes sem fio ao n central da rede O conceito goal for all of Heckerman s research com a busca no Google leva a seis endere os na Web todos referentes ao mesmo conte do O primeiro endere o da pr pria holding Microsoft htto www microsoft com presspass features 1999 03 22heckerman mspx apresenta o trecho abaixo esclarecendo do que se trata com grifos nossos Microsoft Research Making Computers More Intelligent and Responsive Microsoft researcher David Heckerman combines probability theory with artificial intelligence to make computers aware of users needs REDMOND Wash March 22 1999 David Heckerman entered Stanford University medical school in 1980 to learn about the human brain At the time he was asking questions like What is the nature of human awareness and Are humans simply fancy computers that can understand and direct their own existence Two decades later Heckerman still contemplates these questions but from a different perspective Rather than questioning whether the brain works like a computer he now asks whether it s possible for a computer to emulate the human brain C
78. o oriundos de sinais da pr pria etiquetagem exemplo na Figura 5 8 geralmente s mbolos de etiquetas e lemas das palavras etiquetadas e de tokens que n o interessam no contexto Isso ocorre porque a busca em modo collocation recupera trechos de senten as em horizontes predefinidos pelos usu rios e n o palavras etiquetadas isoladas o minerador de texto garante que nesses trechos se encontram as estruturas sint ticas de interesse mas n o realiza a filtragem de ru dos Deve se tamb m nesta etapa eliminar as presen as excessivas de um mesmo substantivo ou sintagma inclusive suas varia es em n mero em princ pio para a an lise de conceitos tanto faz deixar se um substantivo no singular como no plural O pen ltimo passo do processo se refere s atividades de contagem de substantivos e sintagmas plurinominais sem repeti es com uso de um software editor de textos comum como o Microsoft Word O ltimo passo do processo de recupera o da informa o que denominamos na Figura 5 6 Computar substantivos distintos em sintagmas consiste na compara o entre a lista de substantivos e a lista de sintagmas plurinominais computando se o n mero de substantivos que aparecem tamb m na lista de sintagmas Com isso obt m se os dados necess rios para completar as colunas F G e J da planilha do APENSO I 7 Ru dos s mbolos sint ticos de palavras que n o s o de interesse no contexto de an lise de
79. objetos possuem uma imagem correlata ideal mental a priori de sua percep o pelos sentidos humanos tese do idealismo ou se parte da premissa que al m dos objetos ideais h tamb m objetos reais independentes do pensamento humano tese do realismo Hessen 1976 ao final conclui que a tese do realismo filosoficamente mais defens vel do ponto de vista da fenomenologia uma corrente mais moderna da Filosofia mas n o descarta a utilidade operacional do idealismo em reas de conhecimento mais abstrato como a L gica e a Matem tica Outro aspecto importante na tentativa de conceitua o de conhecimento se refere ao conceito de verdade que se conecta necessariamente ao de conhecimento o conhecimento portanto dever ser o conhecimento verdadeiro O conhecimento sem conex o com a verdade n o seria conhecimento e portanto n o teria a necess ria credibilidade para generaliza o nas ci ncias em geral Contudo isso leva a outra quest o o que ou qual a verdade 44 Os crit rios de verdade que sustentam a Ci ncia tamb m s o problem ticos e provis rios como as no es de substancialidade sobre as propriedades das coisas e causalidade sobre a rela o de causa e efeito o que implica a necessidade de ado o de conceitos e crit rios de verdade suficientes em contextos Assim como os problemas centrais na defini o rigorosa de conhecimento s o filosoficamente insol veis parte se ent o pa
80. ou propriedade Essa classe atributo por sua vez tamb m pode pertencer a uma classe ainda mais agregada de conceitos no caso de um modelo de objetos com tr s substantivos constituintes ou superclasse e ter uma superclasse de atributos mais consolidada que a diferencie como um membro ou objeto na superclasse de conceito 148 Modelo de Objeto com Modelo de Objeto com Dois Substantivos Tr s Substantivos Classe Classe Classe Classe Superclasse Atributo Atributo Atributo Superclasse Figura 6 2 Modelos Can nicos de Classes Fonte do autor da tese A Figura 6 3 baseada no modelo can nico de Weilkiens e Oestereich 2007 p 46 esclarece esse tipo de estrutura de conceitos representada com UML classe Customer atributo privado Customer Booking Account Position atributo global im il Figura 6 3 Associa o Composi o de Classes Fonte WEILKIENS e OESTEREICH 2007 Weilkiens e Oestereich 2007 p 46 explicam essa estrutura can nica da seguinte forma a classe Customer obteria um atributo account mediante a refer ncia a um objeto da classe CustomerAccount e a classe CustomerAccount obteria um atributo privado bpos com um objeto de cole o ou uma subclasse que se refere aos objetos de BookingPosition O losango preenchido na linha de associa o entre as classes Customer Account e Booking Position significa que os objetos da classe Booking Position per
81. para complementa o e amplia o dos modelos anteriores e gera o de um modelo mais completo de informa o para suporte Gest o do Conhecimento e Intelig ncia Competitiva denominado nesta tese mosaico sem ntico para Intelig ncia Competitiva utilizado como met fora algo parecido com a tela de pintura impressionista inspiradora de Fuld 2007 Os artefatos ou modelos gr ficos que compor o esse mosaico se prestam alguns a fun es anal ticas e outros a fun es estrat gicas por exemplo os modelos de organiza o e de processos seriam mais anal ticos os modelos tem ticos de produtos e parcerias ou de modelos envolvendo o ambiente externo seriam mais estrat gicos 136 A an lise dos processos produtivos das organiza es se destina ao estudo dos custos de produ o requisito de intelig ncia competitiva em mercados de commodities e a an lise dos modelos de produtos e parcerias indispens vel para competi o em mercados marcados pela diferencia o de produtos ou em mercados de nicho Fuld 2007 p 95 coloca a quest o dos processos organizacionais no contexto da Intelig ncia Competitiva do seguinte modo O processo a m e dos custos Compreendendo o processo de um concorrente voc pode derivar sua estrutura de custos e muito mais Ao juntar as pe as de um processo de uma empresa voc pode aprender como melhorar a produ o de seu pr prio produto ou incrementar seu servi o Conhec
82. parecidos na recupera o da informa o As inova es que ele propunha na poca para o desenvolvimento de sistemas de recupera o da informa o tecnologicamente mais aptos para enfrentamento dos desafios do mundo da comunica o em redes de computadores digitais que se avizinhava podem ser hoje observadas em softwares de an lise sint tica parsing e de minera o de textos tais como o uso do recurso de agrupamento clusteriza o por atributo para indexa o e recupera o autom tica de documentos a indexa o sintagm tica com uso de trechos de frases e n o apenas termos isolados o abandono da pr indexa o de documentos numa base textual como medida de economia e a pesquisa em texto completo de modo completamente autom tico Em termos de metodologia para a indexa o autom tica Borko 1981 observa que O computador n o lida com conceitos mas somente com palavras A tarefa projetar um algoritmo para selecionar palavras significativas do texto e como consequ ncia essas representar o conceitos significativos Obviamente Borko prop e essas inova es no escopo de um contexto tecnol gico mais avan ado de indexa o e recupera o autom tica da informa o como o da Internet e dos aplicativos de busca da World Wide Web que se tornaria realidade pouco depois O termo autom tico para ele se aplica a um processo implementado por um conjunto de programas de computador ao inv s de executado co
83. prevejo que uma m quina com uma insaci vel sede de conhecimento e uma igualmente insaci vel necessidade de informar uma chateac o conversacional que n o tem fim o proverbial c o com um osso 7 3 Poss veis linhas de pesquisa decorrentes Considerando que a pesquisa implementada nesta tese se apoiou em tr s pilares epistemol gicos correlatos Ci ncia da Informa o Recupera o da Informa o Engenharia do Conhecimento onde se insere a An lise de Conceito Formal e a modelagem de conceitos e Intelig ncia Competitiva vislumbram se igualmente tr s linhas de pesquisa decorrentes A primeira delas poderia se ocupar de um aprofundamento em quest es de Processamento da Linguagem Natural PLN em contextos de informa es de neg cios como o desenvolvimento de m todos de minera o de conceitos para contextos mais espec ficos O desenvolvimento de softwares com tecnologia de Intelig ncia Artificial para etiquetagem de textos tamb m representa naturalmente um desafio formid vel al m da relev ncia de semelhante iniciativa considerando se a car ncia de recursos tecnol gicos de PLN para o idioma portugu s Outra linha de pesquisa poderia se concentrar em quest es de Engenharia do Conhecimento tais como a elicita o semi autom tica de conceitos relevantes num contexto para desenvolvimento de ontologias profundas a partir de textos com modelos can nicos para aplica es espec ficas a p
84. primeiro bloco de dados se refere aos substantivos nomes minerados anteriormente no contexto Microsoft Research e o segundo ao novo texto mencionado cujo impacto na base de informa o e nos modelos anteriores ser analisado Como a metodologia proposta nesta tese embasada inclusive no estudo de frequ ncias de substantivos nomes encontrados nas colet neas digitais de neg cios e os modelos conceituais produzidos se concentram nos substantivos nomes com frequ ncias de at 10 0 deve se cuidar inicialmente para que as novidades eventualmente presentes nos textos acrescentados base aparecam com substantivos nomes indicativos nessa faixa de freg ncia Ou seja considerando se que os substantivos nomes mais freq entes muito provavelmente compor o sintagmas complexos teis para modelagem conceitual deve se providenciar uma t cnica para que seus respectivos substantivos nomes apare am entre os mais frequentes substantivos nomes preexistentes na base de modo a perturbar modificar sua estrutura inicial e com isso chamar a aten o dos engenheiros do conhecimento Caso se decida apenas adicionar os novos textos base preexistente e calcular os par metros de frequ ncia novamente provavelmente as novidades n o aparecer o perturbando a base porque como l gico se esperar os novos textos ser o bem menores que a base existente e consequente os substantivos nomes mais frequentes ter o frequ ncias muito menores que as
85. que a estrutura do conhecimento K S alterada para a nova estrutura modificada K S AS pela informa o Al e AS indicando o efeito dessa modifica o O modelo de gest o do conhecimento proposto nesta tese a partir de uma base de informa o conceitual minerada em contextos organizacionais competitivos parte dessas no es fundamentais Com os sintagmas representando substantivos mais frequentes nos contextos da minera o textual como demonstrado no experimento de laborat rio obt m se o n cleo conceitual praticamente livre de problemas sem nticos a partir do qual se poder irradiar o pensamento de modo indutivo ou dedutivo em Intelig ncia Competitiva Esse n cleo conceitual que pode ser transformado no n vel individual e coletivo no fator K S de conhecimento de Brooks 1980 poder ent o ser ampliado com as informa es conceituais complementares fator Al contidas nas ramifica es a partir desse n cleo como apresentado nos modelos conceituais integrados deste cap tulo de modo a se aumentar o estoque de conhecimento do engenheiro do conhecimento e das equipes de neg cio em AS Esse modelo conceitual constituir o que denominamos nesta tese de meio de acesso direto informa o para desenvolvimento de intelig ncia na organiza o competitiva Como vantagem do uso de modelos conceituais para visualiza o da informa o conceitual Ontoria De Luque e G mez 2006 p 26 argumentam Com o agrupamen
86. rede de relacionamentos que no final os conectam a conceitos concretos Outras estrat gicas de busca da informa o com minera o textual para constru o e popula o de ontologias como a proposta por Cimiano 2006 utilizam sintagmas compostos por substantivos e verbos correlatos com a vantagem de facilitar sua classifica o posterior em contextos mas com a desvantagem da necessidade de forma o de atributos adjetivados a partir dos verbos Considera se essa estrat gia particularmente complexa tanto no processo de transforma o de verbos em adjetivos como em sua desambigua o posterior pois pode se chegar conclus o que alguns atributos t m mais de um significado problema de polissemia ou que alguns atributos podem ser fundidos devidos sinon mia Estrat gias dessa natureza com uso de verbos apresentam outras desvantagens pois sua representa o posterior tamb m ser naturalmente mais complexa pelos seus aspectos de estrutura predicativa O uso de Gr ficos Conceituais SOWA 1984 seria uma soluc o mas alguns experimentos de laborat rio nessa dire o realizados no desenvolvimento desta tese t m mostrado a inviabilidade de representa o visual de conte dos de textos mais extensos que uma ou duas p ginas de um s tio na World Wide Web por exemplo Contudo esse tipo de representa o da informa o textual com substantivos nomes e verbos ser discutido mais adiante nesta tese nos resultados
87. rela o de propriedade do atributo pela classe objeto c Classe r Classe nome Reserva nome Cliente tipo tipo pi Propriedade assocExtrem assocExtrem nome reservas p2 Propriedade nome reservante Associa o Figura 3 10 Exemplo de Reposit rio na UML Fonte WEILKIENS e OESTEREICH 2007 As associa es entre classes e entre classes e atributos tamb m podem ser n rias na UML ou seja uma associa o pode ter mais que duas extremidades como na rela o entre as classes Avi o Passageiro e Assento Este tipo de rela o de associa o teria tr s extremidades sendo uma para cada classe com todas as tr s classes se relacionando entre si O ponto de encontro das linhas de associa o nesses casos prev um losango sem preenchimento Outra representa o da informa o com UML considerada til no contexto o de atividades que se relacionam com processos de neg cio numa organiza o O padr o da UML adota neste caso representa es pict ricas derivadas de Redes Petri com uso de ret ngulos com v rtices arredondados ret ngulos com v rtices de ngulos retos setas e textos indicativos de a es A Figura 3 11 apresenta um exemplo de modelo de atividade com UML ilustrado por Weilkiens e Oestereich 2007 p 78 O ret ngulo maior representa as bordas limites do modelo pict rico da atividade como um todo os ret ngulos me
88. repetindo se o mesmo procedimento de busca no Google para Microsoft Research and Research Platform for Sensor Networks obt m se apenas dois endere os http www groklaw net articlebasic php story 200706 14231022599 e http research microsoft com en us about brochure 8 aspx O primeiro apresenta uma an lise cr tica sobre o comportamento da holding Microsoft em pesquisa e desenvolvimento que para o autor trata se de uma compra de c rebros das universidades a pre os competitivos para a Microsoft O segundo endere o n o apresenta o conte do sugerido presumindo se que tenha sido removido anteriormente apesar do algoritmo do Google ainda apontar para o mesmo Todavia uma pesquisa mais aberta no Google revela que a Microsoft tem patrocinado pesquisas de redes de sensores consideradas plataformas de pesquisas em alguns projetos como o apresentado no documento do endere o http www csiro au files files porx pdf Outro documento da pr pria Microsoft Research dispon vel no endere o http research microsoft com en us labs asia msrabrochure english pdf confirma esse fato O conceito de redes de sensores trata de dispositivos sens veis sensores para capta o de dados relevantes do meio para armazenamento organiza o e an lise em contextos de gest o do conhecimento pesquisas cient ficas de mudan as clim ticas por exemplo Essa rede constitu da de uma s rie de n s dispersos estrategicamente
89. seguir ilustram o processo b sico de descoberta representa o e aprendizado de ontologias para a modelagem de sistemas organizacionais proposto O modelo parcial de um sistema de informa o de uma oficina mec nica apresentado como exemplo na Figura 1 3 parte de um recorte de texto representado na Figura 1 2 de onde se extraem alguns objetos e estruturas lingu sticas sint ticas reconhecidas como padr o no idioma portugu s com os quais se definem as classes de objetos e seus relacionamentos no contexto O m todo de modelagem ontol gica nessa ilustra o o da UML utilizada no processo de desenvolvimento de sistemas computacionais orientados a objetos O reconhecimento de padr es sint ticos no trecho de texto com uso de um software de Processamento de Linguagem Natural PLN na corrente lingu stica estruturalista de Chomsky 1956 realizado a partir de uma padroniza o das classes de termos utilizados no respectivo idioma mediante a coloca o de uma etiqueta tag ou r tulo indicando a natureza sint tica desse termo ao lado de cada respectivo termo na senten a Esta tarefa no jarg o de PLN denominada Part of Speech POS tagging Observe se na Figura 1 3 que com apenas uma senten a curta pode se identificar inicialmente quatro classes de objetos mec nico motor autom vel e conserto e suas rela es essenciais de composi o um tipo de associa o representado por uma seta partindo da classe d
90. sistemas organizacionais legados de uma organiza o em particular d que tipo de documento digital se mostra mais til para o aprendizado de ontologias de sistemas organizacionais em contextos de neg cios na era da World Wide Web e que tipo de tecnologia de Intelig ncia Artificial IA se mostra mais produtiva para implementa o da metodologia proposta E uma id ia utilitarista que os modelos de sistemas organizacionais produzidos com a metodologia proposta nesta tese exer am o papel de sensores sem nticos para orientar avalia es e decis es corporativas em situa es que exigem intelig ncia no neg cio Com o acr scimo de mais informa es no contexto pode se ent o elaborar e reelaborar modelos de sistemas celeremente em escala razo vel e compar los na dimens o tempo ou seja pode se comparar um modelo anterior representativo de um cen rio com outro posterior a um evento prov vel ou projetado e assim avaliar se os prov veis impactos desse evento sobre os sistemas organizacionais legados Embora os modelos de representa o do conhecimento empregados no experimento sejam bastante expressivos em linguagem natural e com razo vel poder de resolu o sem ntica desambigua o com base na composi o de sintagmas nominais e nas rela es entre conceitos a ltima palavra nesse tipo de avalia o continuar sendo de responsabilidade dos seres humanos envolvidos que ser o em ltima an lise os executiv
91. sobreviva reproduza seus elementos chave e como parte de um ecossistema maior contribua com aquele sistema de modo a ampliar outros sistemas ou membros do ecossistema em geral Estima se que atualmente a Web com informa o aberta congregue um bilh o de usu rios no mundo e 250 milh es de s tios crescendo a um ritmo anual de 30 E que a Web invis vel n o acess vel ao p blico em geral pela Internet contenha 500 vezes mais informa o que a Web aberta QUONIAM 2010 Essa percep o de tend ncia corroborada aproximadamente pelos dados de Fuld 2007 p 156 de anos anteriores utilizando se o Google como refer ncia este indexou mais de 8 bilh es de p ginas da Web at 2004 e a Internet Society of Virginia publicou um artigo estimando em 100 milh es o n mero de s tios nessa poca Overload no original em ingl s 101 Considerando se que esses s tios pertencem na sua esmagadora maioria a organiza es pode se concluir que a Web o maior reposit rio de informa o aberta sobre as organiza es que existe Em termos de qualidade deve se ter em mente que a informa o aberta e gr tis n o rivaliza com a informa o editada das fontes especializadas pr Internet mas apresenta algumas propriedades que estas n o t m abrang ncia de escopo sem limite alta velocidade de fluxo e atualiza o significando que sua variedade de conte dos e o desempenho de seu processo de produ o comunica o dispo
92. t cita ou expl cita se diferencia no n vel das ideias dos sentidos ou dos referentes Frege 2003 p 43 a prop sito advoga que o conte do verdade se encontrar o planeta V nus pode ser observado a leste antes do amanhecer ou logo ap s o p r do sol 75 sempre na conex o verdadeira do sentido com seu referente N s nunca podemos nos preocupar somente com o referente de uma senten a mas novamente o mero pensamento isoladamente n o produz nenhum conhecimento mas somente o pensamento em conjunto com seu referente isto seu valor verdade Em s ntese com base no argumento filos fico de Frege 2003 tem se um requisito de minera o conceitual de textos em fun o do qual se deve tentar conectar os conceitos mais complexos com conceitos cada vez menos complexos num processo recursivo de resolu o sem ntica com nova minera o mais orientada ou supervisionada O modelo proposto de minera o recursiva ilustra a utilidade desse argumento 3 5 2 Relev ncia da informa o 3 5 2 1 Abordagem da engenharia auto informa o O conceito de auto informa o self information uma contribui o das mais antigas para o pr prio conceito de informa o relevante remontando aos prim rdios da comunica o eletr nica uma medida quantitativa de informa o formulada por Shannon 1948 que se relaciona com o conceito de diferen a ou discrep ncia de Bateson 2002 e Weick
93. til para a compreens o da no o de padr es no desenho de processos uma caracter stica de modernas linguagens de nota es de processos de neg cio que pode facilitar sensivelmente o desenvolvimento e populariza o de linguagens de representa o biun vocas e interoper veis do conhecimento entre usu rios de estamentos diversos nas organiza es Em rela o aos SICs tanto os processos de desenvolvimento de software quanto os processos de produ o t m evolu do continuamente mas ainda aqu m da complexidade inerente O n mero de novidades publicadas recentemente na ACM por exemplo sintom tico como se pode observar em v rios artigos publicados em sua biblioteca digital Dietz 2006 apresenta uma an lise de estruturas essenciais de processos de neg cio abaixo da superf cie nas organiza es Outro artigo interessante no contexto o de Gregg e Walczak 2006 sobre extra es de informa es da Web para uso em aplica es de intelig ncia de neg cios ERP Enterprise Resource Planning Planejamento de Recursos Empresariais 41 No Poder Executivo federal do Brasil como ilustra o rg os como Instituto Nacional do Seguro Social Minist rio da Fazenda Minist rio das Minas e Energia e Ag ncia Nacional de Vigil ncia Sanit ria t m projetos dessa natureza com escopo corporativo 48 O entendimento da modelagem da complexidade no contexto de projetos de SICs apresentado de modo bastante abra
94. tomada de decis o depender muito do modelo de gest o da organiza o patrocinadora do esfor o de Intelig ncia Competitiva Outro agrupamento de objetos sintagm ticos do contexto Fujitsu Research que podem gerar um modelo conceitual integrado corresponde aos objetos centrados no subconceito management management issues management reform management science model solutions for management risk management solutions for management issues a Figura 6 11 mostra os relacionamentos sem nticos entre esses objetos Contexto Fujitsu Research Figura 6 11 Conceitos Integrados em Management Fonte do autor da tese O mesmo procedimento recursivo de busca focada no Google com os argumentos Fujitsu Research e solutions for management resulta em apenas dois endere os sendo o primeiro 161 relativo a p ginas Web contendo informa es sobre as atividades de pesquisa e desenvolvimento do FRI http jp fujitsu com group fri en develop tais como novos campos de pesquisa O conte do dessa p gina representa claramente uma mensagem de publicidade sobre os produtos tecnol gicos ofertados pela organiza o com o seguinte t tulo We apply cutting edge science and IT to visualize management issues and provide strong support for our customers in optimizing their operations Entre outros pontos a FRI indica nessa p gina a oferta de servi os de engenharia de log stica confirmando assim a centralidade
95. um endere o http research microsoft com en us about brochure 5 aspx O conte do da primeira p gina desse endere o bastante esclarecedor sobre o envolvimento da Microsoft Reserach com o tema apresentado a seguir grifos nossos Supporting Advances Throughout the Sciences Advances in computer science don t just benefit computing They play a growing role in helping scientists in all fields make new contributions facilitating discovery and advancing the state of the art in everything from health care to education to the environment while also addressing some of society s most pressing challenges Since 1998 Microsoft Research s External Research Division has led the organization s collaborative projects with leading scientists and researchers in academia government and industry to apply the latest innovations in software to scientific challenges in other fields The division also creates open tools technologies and services to support every stage of the research process It also supports the aspirations and potential of early career researchers and promising young scientists around the world through internships scholarships and awards Below is a sampling of how Microsoft researchers and groups are engaging with the broader scientific community 178 Worldwide Collaboration Microsoft Research collaborates with medical researchers at the Ragon Institute of MGH MIT and Harvard the Fred Hutchinson Cancer Research Center the Un
96. utilizando se os argumentos de busca Microsoft and life support systems se referem todos ao conceito de Life support Systems da organiza o Microsoft Research O primeiro deles http research microsoft com en us groups ecology defaultaspx revela de plano a for a sem ntica desse conceito com o seguinte texto grifos nossos Computational Ecology and Environmental Science Developing novel computational tools and methods to predict and mitigate the rapid changes occurring in the earth s life support systems Understanding the earth s life support systems and predicting and mitigating the rapid changes that are occurring in these systems because of human activities is one of the great global scientific challenges humanity is currently facing The programme in ecological and environmental sciences aims to contribute to meeting this challenge by identifying critical scientific problems and developing novel computational methods and tools to address these problems Thus our research is necessarily broad ranging from fundamental theoretical work through data gathering and manipulation to developing advanced predictive models of biotic and coupled biotic and physical systems at scales from local to global In tackling scientific problems in these areas we face a broad range of technological challenges including computational modeling of complex systems integrating models and data data acquisition and management visuali
97. vinculado a um ou mais departamentos da escola As associa es lembram o modelo entidade relacionamento dos bancos de dados indicando a cardinalidade dos relacionamentos entre as classes O modelo da Figura 3 8 de Booch Rumbaugh e Jacobson 2005 p 73 indica que uma escola pode ter um ou mais departamentos um departamento pode ter zero ou um diretor e um ou mais instrutores um instrutor pode estar vinculado a um ou mais departamentos um instrutor pode lecionar em muitos 60 cursos cursos podem ter um ou mais instrutores cada departamento pode ter um ou mais cursos alunos frequentam cursos uma escola pode ter muitos alunos e alunos podem ser membros de uma ou mais escolas Deve se destacar na Figura 3 8 uma diferen a fundamental entre a rela o associativa de depend ncia existencial ou de composi o entre as classes Departamento e Escola representada pelo losango cheio na extremidade da linha pr xima a Escola e a rela o associativa de agrega o entre Instrutor e Departamento representada pela extremidade com losango vazio Weilkiens e Oestereich 2007 p 48 assim definem essas duas modalidades de associa o na UML Agrega o uma associa o expandida pelo coment rio semanticamente n o restrito que as classes participantes n o t m nenhum relacionamento de compara o equitativa ao inv s elas representam uma hierarquia todo partes Agrega o utilizada para descre
98. 00 1928 COOPER W S Bridging the gap between AI and IR Annual ACM Conference on Research and Development in Information Retrieval Proceedings of the 7th Annual International ACM SIGIR Conference on Research and Development in Information Retrieval Association for Computing Machinery 1984 p 259 265 CZARNEWSKI Paulo Cezar SOA Arquitetura Orientada a Servi os In Mostra TIC 2007 Bras lia DF Dispon vel em lt http Avwwsolucoestipublica gov br palestras Desd 3 4 paulo c czarnewisk pdf gt Acesso em 17 jun 2007 DAELEMANS Walter GAZDAR Gerald DE SMEDT Koenraad Inheritance in Natural Language Processing Association for Computing Linguistics 1992 DALE Robert ALIOD Diego Molla SCHWITTER Rolf Evangelising language technology a practically focussed undergraduate program In ASSOCIATION FOR COMPUTATIONAL LINGUISTICS Proceedings of the Workshop of Effective Tools and Methodologies for Teaching Natural Language Processing and Computational Linguistics Philadelphia jul 2002 p 27 32 DAVENPORT Thomas H Ecologia da informa o 3 ed S o Paulo Futura 2000 DAVENPORT Thomas H Process innovation reengineering work through information technology Boston Massachusetts Ernst amp Young Harvard Business School Press 1993 DAVIS Mills ProjectOX s Semantic Wave 2008 Report industry roadmap to Web 3 0 amp multibillion dollar market opportunities executive summary out 2008 Dispon vel em
99. 007 PRADO e FERNEDA 2008 As rela es ling sticas relevantes que podem ser encontradas num texto s o abundantes podendo ocorrer de v rias formas de acordo com as estruturas ling sticas poss veis segundo as regras de uso do idioma do texto estruturais ou funcionais constituindo uma rea do conhecimento que tem atra do interesse de pesquisadores desde meados da d cada de 1950 O artigo seminal de Chomsky 1956 por exemplo resultou de um esfor o de pesquisa patrocinado pelas tr s armas de defesa dos EUA e pela empresa Eastman Kodak interessados nos aspectos comput veis da linguagem natural revelando a natureza pragm tica desse tipo de pesquisa em ambientes organizacionais competitivos Embora o framework metodol gico proposto na tese utilize v rias abordagens de processamento da linguagem natural assim como an lise funcional de textos no processo seletivo de conte dos como dados de entrada no modelo os formalismos elaborados se fundamentam em experimentos de an lise sint tica estruturalista com as estruturas frasais CHOMSKI 1956 e na pragm tica Delbecque por exemplo define sintaxe como o estudo da combina o dos elementos da frase segundo esquemas de constru o regulares e pragm tica como o estudo daquilo que as pessoas fazem quando utilizam a l ngua DELBECQUE 2008 p 114 A an lise sint tica til no contexto porque dentro de dom nios espec ficos da atividade humana co
100. 010 MANDELBROT B An information theory of the statistical structure of language In Communication Theory p 486 502 London Butterworths Scientific Publications 1953 MARCH J G SIMON H A Organizations 2 ed Blackwell 1993 MATHEUS Renato Fabiano Rafael Capurro e a Filosofia da Informa o abordagens conceitos e metodologias de pesquisa para a Ci ncia da Informa o Perspectivas em Ci ncia da Informa o Belo Horizonte v 10 n 2 p 140 165 jul dez 2005 MCGEE James PRUSAK Laurence Gerenciamento estrat gico da informa o Tradu o de Astrid Beatriz de Figueiredo 11 ed Rio de Janeiro Campus 1994 209 MEADOW Charles T BOYCE Bert R KRAFT Donald H BARRY Carol Text information retrieval systems 3 ed Elsevier 2007 MICHAUD Claude Modelos e Conhecimento In TARAPANOFF Kira Org Intelig ncia informa o e conhecimento Bras lia IBICT e UNESCO 2006b p 211 239 MINEAU Guy STUMME Gerd WILLE Rudolf Conceptual structures represented by Conceptual Graphs and Formal Concept Analysis n TEPFENHART W CYRE W Eds Conceptual Structures Standards and Practices Proceedings of the 7 International Conference on Conceptual Structures LNAI 1640 Berlin Springer 1999 p 423 441 MINSKY M Semantic information processing Cambridge Massachusetts MIT Press 1968 NATIS Yefim V SCHULTE Roy W Business component architecture unites services and events Gart
101. 1995 constituindo a base cient fica da compress o de dados utilizada na engenharia eletr nica Obviamente como recurso de engenharia a auto informa o mede fundamentalmente a efici ncia na comunica o de sinais teis discrepantes em rela o a um padr o anteriormente conhecido que se revela em situa es tais como o ndice de efici ncia de um algoritmo compactador de sinais eletr nicos num processo de transmiss o de dados Sayood 2000 p 14 apresenta esse conceito da seguinte forma Shannon definiu uma quantidade chamada auto informa o Suponha que temos um evento A que um conjunto de resultados de algum experimento rand mico Se P A a probabilidade do evento A ocorrer ent o a auto informa o associada ao evento A determinada matematicamente pela equa o A log 1 P A log P A Onde i A o valor da auto informa o relacionada ocorr ncia de um evento A e o par metro b depende de cada caso representando o universo de resultados poss veis em rela o a esse evento Quando se tem um evento com apenas dois resultados poss veis como no caso do lan amento de uma moeda tem se b 2 cara e coroa no caso de lan amento de um dado b 6 e assim por diante Assim P A poderia ser a probabilidade de resultar cara no lan amento de uma moeda Intuitivamente pode se compreender esse modelo param trico de informa o relevante com o argumento l gico matem tico de Sayoo
102. 2 more J Todi client s e commerce IT operations accuracy and 7 i 3 A industry customer account transactions relevance of supply chain data history of helping clients Web services construction 2mere ana vewveerevrnologists knowledge management experts a business Sor clients business professionals 7 mare clients in a number of fields clients web site performance 12 mare Web browsing for low vision users Web transaction performance metrics Figura 5 10 Reticulado de Conceitos Fonte do autor da tese A no o de differentiae de Arist teles implica que os conceitos situados na parte mais acima no reticulado s o mais gen ricos compostos por objetos com menos atributos no contexto e os conceitos mais abaixo na rede s o mais espec ficos compostos por objetos com mais atributos no contexto Essa trama algo como uma grelha do ser de Delbecque 2006 relaciona e mostra ao analista de modo visual todas as rela es entre conceitos e propriedades ontol gicas suportadas pelo m todo hiperon mia homon mia extens o intens o superconceito subconceito Como medida para despolui o do reticulado para clarear o cen rio de conceitos o engenheiro do conhecimento pode optar num determinado momento pela supress o das caixas de textos com os objetos classificados e trabalhar apenas com os t tulos de atributos e os c rculos de conceitos derivados Figura 5 11 Em part
103. 7 por exemplo representa o estado da arte em metodologias de an lise e refatora o de software legado para reuso em componentes abrindo novo alento para o desenvolvimento de arquiteturas de sistemas computacionais orientadas a servi o Service Oriented Architecture ou SOA no jarg o da ind stria do software Stumme 2002 esclarece a respeito dessa tend ncia que esse vetor de desenvolvimento tecnol gico nasceu de uma uni o de esfor os entre as comunidades de An lise de Conceito Formal e de Gr ficos Conceituais SOWA 1984 MINEAU STUMME WILLE 1999 32 FCA Formal Concept Analysis 36 As estruturas da ACF que s o fundamentais para a representa o da informa o em contextos como o da presente tese t m sido descobertas por diferentes pesquisadores Contemporaneamente ao desenvolvimento da An lise de Conceito Formal reaparecem as teorias matem ticas do reticulado lattice tamb m denominado Reticulado de Galois cuja integra o num construto de recupera o da informa o com ACF atribu da a Godin Gecsei e Pichet 1989 com base nos estudos seminais de Barbut e Monjardet 1970 O uso de ACF em metodologias de IA como aprendizado de m quina descoberta de conhecimento e minera o de dados aparece mais recentemente nos artigos de Kuznetsov 2004 e de Valtchev Missaoui e Godin 2004 Contudo o texto introdut rio mais completo ACF o de Wille 2005 que ressalta a ACF como um subcampo da ma
104. 7 jul 2006 BITTELSTONE Robert XPL an expert systems framework in APL Association for Computing Machinery 1985 203 BOOCH Grady RUMBAUGH James JACOBSON Ivar The Unified Modeling Language user guide 2 ed Addison Wesley 2005 BORKO Harold Automatic indexing a tutorial Association for Computing Machinery SIGIR Automatic Information Retrieval 9 11 nov 1981 BRACHMAN Ronald J MCGUINNESS Deborah L Knowledge representation connectionism and conceptual retrieval In Association for Computing Machinery SIGIR 88 Proceedings of the 11th Annual International ACM SIGIR Conference on Research and Development in Information Retrieval maio 1988 p 161 174 BREUKER J A WIELINGA B J Interpretation of verbal data for knowledge acquisition n O SHEA T Ed Advances in Artificial Intelligence Amsterdam North Holland 1987 BROOKS Bertram C The foundations of Information Science Part Philosophical Aspects Journal of Information Science n 2 p 125 133 1980 BUITELAAR P OLEJNIK D SINTEK M A Prot g plug in for ontology extraction from text based on linguistic analysis In Proceedings of the 1 European Semantic Web Symposium ESWS 2004 p 31 44 BUITELAAR P SACALEANU B Extending synsets with medical terms n Proceedings of the First International WordNet Conference 2002 BUSH Vannevar As we may think Atlantic Monthly maio 1945 Dispon vel em lt http www2 theAtla
105. 993 p 6 O modelo de servi os conforme Spohrer e Riecken 2006 ainda n o tem uma ci ncia para si ao passo que os processos est o hoje no centro das aten es dos desenvolvedores de pacotes de softwares corporativos no mercado su tes de gest o de conte dos eletr nicos de fluxos de trabalho ERP entre outros pelas suas rela es muito pr ximas com os sistemas de informa o baseados em computador O renovado entusiasmo com a reengenharia tamb m tem contribu do para esse interesse haja vista a prolifera o de iniciativas de desenvolvimento de novos modelos de gest o nas organiza es tanto na iniciativa privada como no setor p blico Maglio 2006 evidencia lacunas epistemol gicas no que ele denomina sistemas de servi os Natis e Schulte 2004 esbo am conex es entre servi os e eventos na arquitetura de componentes de software de suporte a processos de neg cio e Robredo 2000 aborda o tema processos como preliminar ao desenvolvimento de SICs temas correlatos conhecida obra de Prahalad e Krishnan 1999 sobre qualidade na sociedade da informa o A obra de Oliveira 2004 tamb m interessante no contexto pela abordagem in dita de modelos de gest o com foco em processos e na certifica o de qualidade E Bitner e Brown 2006 lan am uma esp cie de provoca o comunidade acad mica a respeito da Ci ncia dos Servi os nas escolas de Administra o O livro de Havey 2005
106. Animais Famosos ore Atributos Objetos animais desenho real tartaruga cao gato mamifero Garfield X X X Snoopy X X X Socks X X X Greyfriar s Bobby X X X Harriet X X A Conex o de Galois uma no o central para a ACF implicando que objetos com poucos atributos ser o sempre mais abundantes no mundo que objetos com muitos atributos Essa no o observada comumente quando se trata de documentos e termos contidos nos mesmos algo familiar na indexa o e recupera o da informa o quando se deseja documentos com muitos conte dos espec ficos termos palavras chave ou sintagmas o n mero de documentos recuperado a revoca o menor que quando se deseja documentos com menos conte dos espec ficos documentos mais gen ricos Observa se na Tabela 3 2 objetos na coluna esquerda e atributos nas demais colunas com as respectivas marca es em X de incid ncia de atributos em objetos Os animais famosos t m atributos coincidentes ou n o entre si Garfield e Snoopy apresentam o atributo desenho cartoon ou seja n o s o animais reais mas criados por cartunistas e s o ambos mam feros contudo enquanto Garfield um gato Snoopy um c o Os animais com nomes Socks Greyfriar s Bobby e Harriet s o reais o primeiro era o gato da fam lia Clinton na Casabranca o segundo um c o lend rio de Edinburgo Esc cia e o terceiro considerado um dos an
107. Computing Machinery 1983 208 LEE Juhnyoung Model driven business transformation and the Semantic Web Communications of the ACM v 48 n 12 p 75 78 dez 2005 LEIDNER Jochen L Current issues in Software Engineering for Natural Language Processing n Association for Computational Linguistics SEALTS 03 Proceedings of the HLT NAACL 2003 Workshop on Software Engineering and Architecture of Language Technology Systems v 8 maio 2003 p 45 50 LIEBOWITZ Jay Strategic Intelligence Business Intelligence Competitive Intelligence and Knowledge Management Auerbach 2006 LIMA MARQUES Mamede MACEDO Fl via Lacerda Oliveira Arquitetura da Informa o base para a gest o do conhecimento In TARAPANOFF Kira Org Intelig ncia Informa o e Conhecimento Bras lia IBICT e UNESCO 2006b LIN D Automatic retrieval and clustering of similar words In Proceedings of the 36 Annual Meeting of the Association for Computational Linguistics and 17 International Conference on Computational Linguistics COLING ACL 1998 p 768 774 LIN D PANTEL P Induction of semantic classes from natural language text n Proceedings of the ACM SIGKDD Conference on Knowledge Discovery and Data Mining 2001 p 317 322 LINDIG Christian SNELTING Gregor Assessing modular structure of legacy code based on mathematical concept analysis ACM ICSE 97 Boston MA USA 1997 LISPECTOR Clarice A hora da estrela Rio de Janeiro Ro
108. Conference 2005 p 593 606 SCH TZE H Word space In Advances in Neural Information Processing Systems 5 1993 p 895 902 211 SCOTT Mike WordSmith tools version 5 0 Liverpool UK Lexical Analysis Software 2008 SEARLE Leroy KEELER Mary SOWA John DELUGACH Harry LUKOSE Dickson Fulfilling Peirce s dream conceptual structures and communities of inquiry n LUKOSE Dickson DELUGACH Harry KEELER Mary SEARLE Leroy SOWA John Eds Conceptual Structures Fulfilling Peirce s Dream Fifth International Conference on Conceptual Structures ICCS 97 Seattle Washington USA August 1997 Proceedings p 1 11 SHANNON C E A mathematical theory of communication The Bell System Technical Journal v 27 p 379 423 jul out 1948 SILVA E M PRADO H A do FERNEDA E Text Mining crossing the chasm between the academy and the industry n ZANASI A BREBBIA C A EBECKEN N F F E MELLI P Data Mining III Southampton Boston WIT Press 2002 p 351 361 SILVA Ivanosca A BEDREGAL Benjamin R C LUCENA M rcia J N R GOTTGTROY M rcia P B Um framework para desenvolvimento de sistemas complexos Dispon vel em lt http www dimap ufrn br bedregal publications pub2001 clei2001 lvanosca PDF gt Acesso em 30 abr 2005 SIMPSON Rosemary RENEAR Allen MYLONAS Elli VAN DAM Andries 50 Years after As We May Think The Brown MIT Vannevar Bush Symposium Interactions mar 1996 Disp
109. Conhecimento para Intelig ncia Competitiva Como o contexto IBM Research se refere a uma organiza o do mercado de tecnologias da informa o e comunica o TIC a centralidade da informa o no conceito de System n o apresenta novidade Contudo deve se observar que a classe System aparece com duas fun es estruturais distintas a primeira como em System Management na condi o de atributo de classifica o de outro conceito onde System Management apenas uma inst ncia da classe Management e a segunda como em Healthcare Systems indicando que Systems uma classe essencial neste caso Healthcare Systems um tipo ou uma inst ncia de System Healthcare System uma esp cie do g nero System Ou seja numa interpreta o no ambiente de neg cios desse contexto corporativo Systems se refere em alguns casos a instrumentos de gest o de sistemas de informa o que podem ser outros sistemas de informa o como os aplicativos de gerenciamento de computadores servidores ou de redes de computadores e noutros casos a tipos de sistemas de informa o produzidos pela organiza o Os conceitos de Device Management Systems e Disclosure Management Systems s o sistemas computacionais destinados ao gerenciamento de outros sistemas computacionais pois device no caso se refere a dispositivos de hardware e disclosure aber
110. Figura 6 10 tamb m mostra outro aspecto importante enquanto os objetos sintagm ticos centrados em Delivery s o encontrados entre os sintagmas que representam os 2 5 de substantivos mais freq entes no contexto os objetos centrados em Service e Value n o se encontram nesse grupo de sintagmas mas entre um grupo de sintagmas que representam substantivos n o t o freq entes mas entre os 10 mais freq entes no contexto Com isso evidencia se a vantagem da integra o de modelos conceituais contendo substantivos mais freq entes e menos freq entes ainda que dentro de um grupo maior de substantivos mais freq entes os 10 mais freq entes no caso Considerando se que historicamente o nicho de mercado da organiza o Fijitsu Research o de solu es tecnol gicas com uso de computa o eletr nica pode se destacar como conceitos de neg cios relativamente menos prov veis os da Figura 6 10 e n o os da Figura 6 11 Delivery Costs Value in Service Innovations Value Pricing Transportation and Delivery Plans e Visualization of Value in Service E isso se torna evidente na medida em que o engenheiro do conhecimento entenda que os conceitos centrais Service Delivery e Value s o menos prov veis que Management no contexto Conforme as teses de Bateson 2002 Weick 1995 e Choo 2003 o fragmento de modelo conceitual da Figura 6 10 pela relativa novidade das info
111. ICs apresentado por McGee e Prusak 1994 Davenport 2000 e v rios outros pesquisadores organizacionais McGee e Prusak 1994 refor am a tese das limita es das TICs com os seguintes argumentos Os investimentos em tecnologia da informa o eram apregoados por vendedores consultores e jornalistas como ferramentas que criariam uma revolu o no mundo executivo mas a verdade que muito pouco desse sonho se realizou A pesquisa de Stephen Roach sugere que a produtividade dos executivos n o cresceu muito nos ltimos vinte anos apesar da magnitude do investimento Um outro canto da sereia que atraiu muitos nas ltimas duas d cadas foi a id ia de que os investimentos em tecnologia da informa o podem ser estrat gicos capazes de criar uma vantagem competitiva substancial embora existam evidentes vantagens comerciais a curto prazo quando se o primeiro a utilizar um novo sistema o mercado far com que tais vantagens continuem a ser de curto prazo MCGEE e PRUSAK 1994 p 6 7 McGee e Prusak al m de consultores de empresas s o tamb m profissionais praticantes da Ci ncia da Informa o Conforme Davenport 2000 Prusak tem experi ncia em biblioteconomia e McGee atuou com Davenport em pesquisas sobre o hoje difundido conceito de 23 ecologia da informac o DAVENPORT 2000 Este ltimo relata como testemunha ocular privilegiada da realidade das empresas em termos de gest o da informa o Na ma
112. IRCE Charles S Semi tica Tradu o de Jos Teixeira Coelho Neto 4 ed S o Paulo Perspectiva 2010 PEIRCE Charles Sanders Existential Graphs Coment rios de John F Sowa baseado no Manuscrito MS 514 depositado na Houghton Library Harvard University 1909 Dispon vel em http www jfsowa com peirce ms514 htm Acesso em 12 jul 2009 PENTEADO Roberto BOUTIN Eric Creating strategic information for organizations with structured text n PRADO H rcules Antonio do FERNEDA Edilson Orgs Emerging Technologies of Text Mining techniques and applications Hershey New York Information Science Reference 2008 p 34 53 PERINI M A Gram tica descritiva do Portugu s 4 ed S o Paulo tica 2003 PESONEN Juha Petteri Concepts and object oriented knowledge representation MA Thesis University of Helsinki Department of Cognitive Science fev 2002 PIDD Michael Computer simulation in management Science 2 ed John Wiley amp Sons 1988 PRADO H rcules Antonio do FERNEDA Edilson Orgs Emerging technologies of text mining techniques and applications Hershey New York Information Science Reference 2008 PRAHALAD C K KRISHNAM M S The new meaning of quality in the information age Harvard Business Review v 77 n 5 set 1999 210 PRESSMAN Roger S Engenharia de Software Tradu o de Jos Carlos Barbosa dos Santos S o Paulo Makron Books 1995 PRISS Uta Formal Concept Analysis
113. RCE 2010 p 284 32 O autor observa que as vantagens do casamento entre RI e IA para o desenvolvimento de sistemas de recupera o da informa o eram ignoradas na poca por raz es hist ricas e pragm ticas E que o interesse das pesquisas em RI estava se movendo para a formula o de uma vis o unificada dos modelos de recupera o probabil sticos combinat rios e l gicos num modelo baseado na teoria dos conjuntos nebulosos O texto de Doszkocs 1986 did tico esclarecendo a origem siamesa da IA e da PLN nos prim rdios da computa o eletr nica nos anos 1960 Como os demais autores da corrente lingu stica pragm tica ressalta que os tecn logos praticantes de IA descobriram que a captura do conhecimento humano especializado em objetos materiais absolutamente essencial para o sofisticado processamento da linguagem natural e que tal processamento parece ser exequ vel em reas bem restritas de objeto bem definido a fim de se alcan ar efici ncia e utilidade Barnett Knight Mani e Rich 1990 apresentam um artefato computacional que denominam sistema de Conhecimento e Processamento da Linguagem Natural CPLN para aplica es em interfaces inteligentes recupera o de textos e tradu o de m quina Os autores ressaltam quest es importantes como a naturalidade e facilidade portanto para os humanos do uso da linguagem natural para a comunica o com m quinas uma tautologia naturalmente ignorada pelos projet
114. Rela o Subconceito Superconceito Fonte PRISS 2005 Em termos de compreens o dos agrupamentos de objetos no reticulado de conceitos aqueles que se situam nos n s mais acima representam um conjunto maior que os que se situam nos n s mais abaixo constituindo a no o de extens o Ou seja pela dualidade da Conex o de Galois conclui se que objetos com menos atributos menor n mero de itens intensionais s o mais abundantes no mundo formando conjuntos com mais elementos como nos casos da extens o Harriet Bobby Socks com o atributo real intens o e a extens o do n mais abaixo com somente Bobby Socks mas com os atributos intens o real mam fero E do ponto de vista dos atributos ou da intensionalidade objetos n s mais acima no reticulado t m um n mero menor de atributos ou seja s o mais gen ricos que os que est o em n s mais abaixo no reticulado Os objetos situados mais abaixo t m mais atributos e s o portanto mais espec ficos que os acima t m intensionalidade mais detalhada Priss 2005 apresenta alguns exemplos da variedade de aplica es poss veis da ACF mencionando os reticulados cruzando documentos e termos de Salton 1970 um dos construtos basilares da recupera o da informa o formalismos de representa o do conhecimento da Intelig ncia Artificial recupera o da informa o de componentes de softwares legados em linguagens de programa o de computador e sistem
115. SON Robert A The concept concept the wayward path of cognitive science Mind amp Language v 15 n 2 e 3 p 308 318 abr jun 2000 KING Margaret Evaluating Natural Language Processing systems Communications of the ACM v 39 n 1 p 73 79 jan 1996 KNELLER George F A ci ncia como atividade humana Tradu o de Antonio Jos de Souza Rio de Janeiro Zahar S o Paulo EDUSP 1980 KOCH Ingedore Villa a O texto e a constru o dos sentidos S o Paulo Contexto 1997 KOCH V SILVA M C P S Ling stica aplicada ao portugu s sintaxe S o Paulo Cortez 1985 KOLL Matthew B WEIRD an approach to concept based Information Retrieval SIGIR Forum Spring 1979 Association for Computing Machinery v 13 n 4 1979 KONCHADY Manu Text mining application programming Boston Charles River Media 2006 KUZNETSOV S Machine Learning and Formal Concept Analysis n EKLUND P Ed Concept Lattices 2 International Conference on Formal Concept Analysis LNCS 2961 Berlin Springer 2004 p 287 312 LANDAUER T DUMAIS S A solution to Plato s problem the latent semantic analysis theory of acquisition induction and representation of knowledge Psychological Review n 104 p 211 240 1997 LEASE Matthew Natural Language Processing for Information Retrieval the time is ripe again ACM PIKM 07 9 nov 2007 Lisboa Portugal LEBOWITZ Michael Intelligent information systems Association for
116. TTT gt log HHH amp TTT B log 77 UM urantearene arrr 7 7 109 PM ramtusruna arri 109 3 4 0 138 Conclui se com base no c lculo de auto informa o que os resultados iguais cara cara cara ou coroa coroa coroa cont m muito mais auto informa o que os resultados de combina es outras mais comuns nos tr s lan amentos de uma moeda Ou seja tr s resultados iguais em sequ ncia causam mais surpresa que tr s resultados mesclando cara e coroa Outra propriedade do modelo matem tico de auto informa o o c lculo com a composi o de eventos independentes e simult neos Com dois eventos independentes A e B ter amos SAYOOD 2000 p 14 AB log 1 P AB P AB P A P B logo i AB log 1 P A P B AB log 1 P A log 1 P B i AB i A i B O impacto cognitivo esperado com tr s resultados iguais em tr s lan amentos de uma moeda intuitivo mas quando utilizamos esse adjetivo assumimos explicitamente ou implicitamente um determinado contexto que condiciona nosso racioc nio no qual desenvolvemos essa intui o o conhecimento do contexto do evento que nos permite calcular ou estimar as probabilidades de cada resultado poss vel e inferir sobre sua plausibilidade o contexto tamb m que nos permite avaliar o tamanho da surpresa em rela o informa o ou auto informa o sobre os resultados do evento O conceito de au
117. UNIVERSIDADE DE BRAS LIA Faculdade de Ci ncia da Informa o Programa de P s Gradua o em Ci ncia da Informa o MINERA O E MODELAGEM DE CONCEITOS COMO PRAXIS DE GESTAO DO CONHECIMENTO PARA INTELIGENCIA COMPETITIVA ETHEL AIRTON CAPUANO Tese apresentada Faculdade de Ci ncia da Informac o da Universidade de Bras lia como requisito parcial para obtenc o do t tulo de Doutor em Ci ncia da Informa o Professor Orientador Dr Rog rio Henrique de Ara jo Jr Professor Co orientador Dr Cl udio Chauke Nehme Bras lia DF 2010 UNIVERSIDADE DE BRAS LIA Faculdade de Ci ncia da Informa o Programa de P s Gradua o em Ci ncia da Informa o MINERA O E MODELAGEM DE CONCEITOS COMO PRAXIS DE GESTAO DO CONHECIMENTO PARA INTELIGENCIA COMPETITIVA ETHEL AIRTON CAPUANO Tese apresentada Faculdade de Ci ncia da Informac o da Universidade de Bras lia como requisito parcial para obtenc o do t tulo de Doutor em Ci ncia da Informa o Professor Orientador Dr Rog rio Henrique de Ara jo Jr Professor Co orientador Dr Cl udio Chauke Nehme Bras lia DF 2010 FOLHA DE APROVA O Peirce entendeu tanto como qualquer dos seus ancestrais filos ficos que nunca f cil ser um metaf sico realista particularmente se o mesmo abranger como Peirce o fez a necessidade de experimentac o e as modalidades do poss vel do prov vel e suas chances de serem constituintes da realidade LUKOSE et a
118. Wei A organiza o do conhecimento como as organiza es usam a informa o para criar significado construir conhecimento e tomar decis es Tradu o de Eliana Rocha S o Paulo SENAC 2008 CHOO Chun Wei Towards an information model of organizations The Canadian Journal of Information Science v 16 n 3 p 32 62 1991 CHURCH Kenneth W RAU Lisa F Commercial applications of Natural Language Processing Communications of the ACM v 38 n 11 p 71 79 nov 1995 CIARAMITA M GANGEMI A RATSCH E SARIC J ROJAS I Unsupervised learning of semantic relations between concepts of a molecular biology ontology In Proceedings of the 19 International Joint Conference on Artificial Intelligence IJCAI 2005 p 659 664 CIMIANO P HANDSCHUH S STAAB S Towards the self annotating Web In Proceedings of the 13 World Wide Web Conference WWW 2004 p 462 471 CIMIANO Philipp Ontology learning and population from text algorithms evaluation and applications Springer Science 2006 CNET Newsmaker Gates explains why Microsoft needs Yahoo 20 fev 2008 Dispon vel em lt http news cnet com Gates explains why Microsoft needs Yahoo 2008 1014 3 6231341 html Acesso em 17 jun 2010 COHEN Michael D MARCH James G OLSEN Johan P A garbage can model of organizational choice Administrative Science Quarterly v 17 n 1 p 1 25 mar 1972 CONDON E U Statistics of vocabulary Science n 1 733 p 3
119. a o aos seus efeitos sociais e econ micos de longo prazo O uso cada vez mais intensivo de avan ados sistemas de comunica o digital pelas popula es em geral como correio eletr nico e telefone sem fio com tecnologia celular transformou o computador dom stico e o telefone port til em equipamentos eletrodom sticos incorporados aos h bitos de consumo de pessoas comuns trabalhadores em geral estudantes crian as e adolescentes etc Concomitantemente as organiza es acompanharam esses movimentos construindo sua imagem digital na WWW disponibilizando cada vez mais completos e sofisticados s tios ou portais de informa o corporativa acess veis por sua clientela e parceiros por meio da Internet Autores como Davydov 2001 p 25 por exemplo definem esse inovador ambiente de informa o em rede como ciberespa o com os seguintes significados Eu defino ciberespa o como um ecossistema conceitual baseado na informa o onde todos os dados informa o potencial s o armazenados tamb m o ambiente de infra estrutura onde todos os trabalhadores da informa o existem e operam Se aceitarmos a no o que ciberespa o um ecossistema ent o para melhor compreender seus princ pios podemos nos voltar para os modelos sugeridos pela Teoria Geral de Sistemas que a cibern tica A cibern tica nos fala que informa o energia que necessita ser consumida e processada por um sistema para que ele
120. a o de oportunidades e gargalos nos processos de desenvolvimento distribui o e aplica o dos recursos de conhecimento e m todos para compreens o das estruturas e processos utilizados pelos trabalhadores do conhecimento nas organiza es e m todos para integra o das tecnologias da informa o no suporte s atividades dos trabalhadores do conhecimento e uma metodologia para a constru o de melhores sistemas baseados no conhecimento Os m todos de racioc nio cient fico fundamentais utilizados nesta tese s o o da retrodu o e da abdu o mencionados por Peirce 2010 o primeiro justificando o experimento de laborat rio realizado e o segundo o processo de forma o de uma hip tese explanat ria acerca do fen meno informacional estudado 1 1 Competitividade e sistemas de neg cios O projeto de pesquisa multidisciplinar que fundamenta esta tese aborda um tema central na Ci ncia da Informa o aplicada ao ambiente das organiza es competitivas a gest o da informa o e do conhecimento Como pesquisa experimental o trabalho se concentra no desenvolvimento de uma metodologia com uso de Intelig ncia Artificial IA para minera o e modelagem de informa es textuais com objetivo de suportar processos de desenvolvimento de Intelig ncia Competitiva em organiza es e seus sistemas de neg cios Esses processos de intelig ncia no entanto n o s o pensados ad hoc mas no escopo de uma proposta mais ampla de
121. a o t cnica dispon vel geralmente n o suficiente para que outros desenvolvedores possam conhecer no curto prazo todos os detalhes dos c digos de programa o de modo a projetarem as mudan as necess rias Esse tipo de atividade denominado refatora o de c digo LINDIG 1997 com objetivo de transformar SICs monol ticos em conjuntos de componentes encapsul veis e reaproveit veis em novos SICs atualizados ou readaptados para novos servi os e processos de neg cio Il A necessidade de se estimar custos e cronogramas de desenvolvimento de SICs a priori da modelagem sendo que a pr pria modelagem integra o processo de desenvolvimento Linguagens de programa o de computadores primitivas mais pr ximas da linguagem de m quina costumam apresentar desempenho melhor em termos de velocidade de processamento que linguagens mais modernas mais pr ximas da linguagem natural 3 e custos e cronogramas constituem resultados da modelagem recaindo se num paradoxo de modelagem recursiva lll A vis o de sistemas independente das vis es de processos e pessoas como se essas tr s dimens es organizacionais n o constitu ssem um todo sist mico Como consequ ncia necessidades de mudan as nos SICs legados se chocam com anseios naturais de estabilidade nos processos de trabalho e na situa o funcional das pessoas O problema central abordado na pesquisa se refere portanto complexidade inerente rejmodelage
122. a 6 19 187 Tabela 6 2 Simula o Gen rica de Minera o Conceitual Recursiva Contexto Warning System for Automobiles Produto e Fabricante Aplica o N Nomes Comerciais AW AX ai AZ 1 Produto Fabricante A e 2 Produto Il Fabricante B e e 3 Produto III Fabricante C E e 4 Produto IV Fabricante D e e e N Produto M Fabricante Z e Produto Il Fabricante B J Produto IV Fabricante D Produto M Fabricante Z Figura 6 19 Reticulado de Conceitos do Contexto Warning System for Automobiles Fonte do autor da tese A organiza o patrocinadora do estudo de intelig ncia neste caso poder optar por competir com os atuais players fabricando outro produto com aplica es similares ou se tornar um competidor entrante fabricando um produto com funcionalidades diversas dos produtos existentes nesse mesmo nicho de mercado O processo recursivo com minera o modelagem e an lise conceitual poder ser repetido em v rios n veis sem nticos partindo de conceitos mais abstratos para conceitos mais substantivos Figura 6 20 Quanto aos modelos de classes conceituais estes tamb m poder o ser ampliados e integrados com classes mais substantivas podendo se elaborar modelos mentais t o extensos quanto se tornarem confort veis para a visualiza o e compreens o humana 188 Figura 6 20 Reticulados de Conceitos Recursi
123. a Web no est gio de Web 3 0 e al m conforme a Figura 5 3 O processo de cria o de significado neste caso se encontra estruturado previamente pelos pesquisadores da evolu o prov vel da Web representando uma op o importante a ser considerada pelo engenheiro do conhecimento no est gio seguinte do construto de Choo 2003 a constru o do conhecimento Com essas informa es relevantes sobre a evolu o da Web a quest o padr o que se apresenta evidente Quais os impactos mais prov veis dos servi os eletr nicos de assist ncia a processos de compras sobre a organiza o que patrocina o esfor o de Intelig ncia Competitiva O conhecimento de contexto dever pois ser constru do em torno das respostas poss veis a essa 170 quest o As organiza es do mercado de TIC ter o certamente seus modelos de neg cio afetados por esse tipo de tecnologia porque elas operam na maioria no conceito de monte voc mesmo seu produto com aux lio de softwares para precifica o autom tica de seus produtos nos Web Portais corporativos Quanto aos demais endere os sugeridos pelo Google o segundo deles http domino watson ibm com odis odis nsf pages focus 01 html leva o internauta ao seguinte conte do apresentando se apenas o cabe alho FOCUS on Innovation in Customer Relationship Management IBM Research Services offers clients an assortment of powerful CRM tools designed to assist in sifting th
124. a de cart es Cielo credenciadora de cart es no pa s bandeira de cart es Visa cart es de d bito cart es Visa e Mastercard diretor executivo de cart es do Panamericano marca de cart o bandeira de cart es Elo uso de cart es cart o Visa pai da mudan a repercuss o do fim do duop lio no setor de cart es executivos da rea de cart es empresas de cart es cart o de d bito com bandeira Visa participa o do cart o terminal de cart es Com esse conjunto de objetos conceituais extra dos numa minera o de textos dirigida um modelo de classes tendo como n cleo o conceito de cart o de cr dito poderia ser representado como na Figura 6 5 Os engenheiros do conhecimento observariam nesse modelo de informa o um conceito bastante expl cito que poderia alert los sobre o que est ocorrendo como Repercuss o do Fim do Duop lio no Setor de Cart es e conceitos mais espec ficos como Maquininha de Cart o O conceito de Fronteira de Cart es um tanto raro na medida em que o termo fronteira apresentado no caso como uma met fora despertando curiosidade natural em torno de seu significado o que poder levar o engenheiro do conhecimento a buscar mais informa es a respeito podendo chegar ao seguinte excerto com grifo nosso da reportagem EXAME p 9 Com o fim da exclusividade prov vel que uma parte dos lojistas que hoje t m duas maquininhas decida ficar apenas com uma
125. a do pr prio conceito de ci ncia ci ncia um modo de perceber e de fazer o que n s chamamos de sentido de nossas percep es Mas a percep o opera somente sobre diferen a Toda recep o de informa o necessariamente a recep o de not cias sobre diferen a e toda percep o de diferen a limitada por limiar Diferen as que s o muito pequenas ou que se apresentam muito vagarosamente n o s o percept veis Elas n o s o alimento para percep o o que n s como cientistas podemos perceber sempre limitado por um limiar Conhecimento em um determinado momento ser uma fun o dos limiares de nossos meios dispon veis para percep o Como um m todo de percep o e isto tudo o que a ci ncia pode querer ser a ci ncia como todos os outros m todos de percep o limitada em sua capacidade de coletar os sinais externos e vis veis daquilo que pode ser a verdade A ci ncia explora ela n o prova Ele observa de um ponto de vista filos fico que para existir diferen a necess ria a exist ncia simult nea de tr s entidades reais ou imagin rias dois objetos e um relacionamento entre os mesmos O modelo de relacionamento entre esses objetos deve ser capaz de evidenciar essa diferen a entre os mesmos ou de mostrar a not cia dessa diferen a que informa o Com esse argumento Bateson 2002 define informa o como a diferen a que faz diferen a e a
126. a esse tipo de aprendizado ontol gico s o apresentadas como resultados da pesquisa experimental desta tese sendo acrescentadas a outras descobertas anteriores de outros pesquisadores em outros contextos T ZS Figura 1 3 Modelo Ontol gico de Sistema de Informa o Conserto Fonte do autor da tese Esta abordagem de minera o de texto diferente das tradicionalmente utilizadas na recupera o da informa o e no aprendizado ontol gico e portanto inovadora porque n o necessita de corpus idiom tico extenso e variado nem de metodologias de suporte a desambigua o Com textos relativamente curtos e aux lio de um simples dicion rio idiom tico pode se descobrir estruturas sint ticas teis para a modelagem autom tica ou semi autom tica de sistemas organizacionais 1 4 Modelos como sensores sem nticos Os problemas espec ficos em cujas solu es se pretende avan ar parcialmente com o framework metodol gico proposto podem ser sintetizados nas seguintes quest es que incomodam o mundo corporativo a como reconhecer formalmente a partir de fontes textuais dispon veis os conceitos do neg cio de uma organiza o para uso na Intelig ncia Competitiva b como reconhecer a partir desses conceitos novas necessidades de informa o de uma determinada organiza o em um contexto de competi o no mercado c como reconhecer formalmente os impactos de mudan as nos ambientes de neg cios sobre os
127. a lista que comp em esse conceito s o advances in processing and algorithms e advent of technologies EA Modelo de Insumo Produto Modelo de Tarefa L accuracy of the soluction nw accuracy rates amounts of data 206 mare piente Externo collaboratio Modelo de Org ganiza o in Modelo de Agente banking ane Center for Business Optimization CBO consultants from IBM Beijing s Tsinghua University access for people account inquiries Rasam transfers fais for thes Seal Taal A 36 more advances in processing and algorithms advent of technologies o gt mare CI banking clientele is SEO delivery and a bites around tl 30 mere wy a a of Mud S business and ES technology consultants b Ja business applications Y 15 more 25 ads client engagements tions a client projects energy grids FE ui consulting nuances of the busi i S7 more puanees tte pusata T tonne lanEE FER client experience ney SENTE WOM nas ofindust m K Y clients e commerce 5 business CEO and En optimization applications ihe itaet 7 rT business consulting decision makers business development process business expansions more El abstraction for the business artifacts allience between business technology research and e collaboration into enterprise systems 1
128. a mesma l gica de apresenta o com os 5 0 7 5 e 10 0 de substantivos mais freq entes em cada texto Os c lculos das rela es entre as quantidades de substantivos mais frequentes que comp em sintagmas QeS e as quantidades absolutas desses mesmos substantivos mais frequentes QAbs revelam que quando se consideram apenas os substantivos mais frequentes ao inv s de todos os substantivos distintos utilizados nos textos obt m se um poder de revoca o de nomes substantivos significativamente maior que no modo todos os nomes substantivos Ou seja utilizando se a conhecida abordagem de indexa o de textos com os termos mais frequentes pode se atingir n veis de desempenho mais elevados na representa o de nomes substantivos em sintagmas plurinominais que denominamos conex o sintagm tica de substantivos mais frequentes com uma propor o ou percentual de revoca o de 80 a 90 ressaltando se que esses sintagmas compor o os conceitos da base de informa o para Intelig ncia Competitiva no modelo de Gest o do Conhecimento proposto 120 Em m dia o percentual de conex o sintagm tica dos 2 596 substantivos mais freq entes nas 15 colet neas da amostra de 90 296 significando que em cada dez substantivos nomes dessa lista de freq ncia nove deles comp em sintagmas compostos por mais de um substantivo nome que se denominam nesta tese objetos ou inst ncias de conceitos Esse desempenho m dio no
129. a na medida em que a Faculdade de Ci ncia da Informa o da Universidade de Bras lia FCI UnB realiza sua transi o de um modelo acad mico disciplinar centrado na Biblioteconomia e na Arquivologia para um modelo multidisciplinar com linhas de pesquisa na p s gradua o t o modernas quanto Gest o da Informa o e do Conhecimento Arquitetura da Informa o e Comunica o da Informa o Esse ambiente tem se tornado atraente para profissionais com os mais variados perfis acad micos e pr ticos com bagagens tanto das Ci ncias Sociais como das Ci ncias Exatas e Engenharias constituindo se gradativamente um ocus privilegiado no Brasil para o desenvolvimento da pesquisa multidisciplinar em Ci ncia da Informa o Com esta tese vislumbrou se uma oportunidade de acrescentar alguns conhecimentos e experi ncias ainda n o desenvolvidos na FCI UnB e talvez ainda n o desenvolvidos em nenhum outro centro acad mico conhecido E n o obstante as inova es em PLN apresentadas na tese pretende se com a pesquisa mostrar tamb m a utilidade de algumas disciplinas ou subdisciplinas correlatas por natureza Ci ncia da Informa o como Lingu stica Ci ncia da Computa o Engenharia de Sistemas e Psicologia 14 2 PROBLEMA TESE OBJETIVOS E RELEV NCIA DA PESQUISA 2 1 Problema geral Considerando se conforme Bates 1999 que se trata de uma tese t pica de engenharia do conhecimento o problema geral para o qual se b
130. acidade de generaliza o de conceitos com GCs na representa o da senten a Todo curso oferecido por um professor universit rio que designa um estudante de doutorado para ser o tutor O modelo de representa o da informa o textual com uso de GC da Figura 3 5 mostra uma variante onde as elipses cont m elas mesmas a rela o entre os objetos dos ret ngulos decorrente do uso dos verbos na senten a com exce o dos c rculos com a indica o de um atributo para o objeto professor e um atributo para o objeto estudante ATTR ATRIBUTE Cao e Creasy resgatam com esse exemplo os conceitos de marcador universal com s mbolo l gico V e de marcador gen rico com s mbolo chamando os de conceito universal e conceito existencial respectivamente UNIVERSIT RIO OFERECIDO POR PROFESSOR ESTUDANTE CURSO V DE DOUTORADO Figura 3 5 Generaliza o com Gr ficos Conceituais Fonte CAO e CREASY 1997 Esses autores argumentam que a for a do GC que sua linguagem gr fica tem um formalismo l gico que a maioria das outras linguagens gr ficas n o tem E afirmam que isto n o somente garante s representa es de um GC significados precisos mas tamb m permite o racioc nio direto sobre essas representa es CAO e CREASY 1997 p 416 Essas observa es s o corroboradas pelas de Sowa apud Wille 1997 p 292 Com seu mapeamento direto para
131. acionais Outro aspecto interessante na obra de Choo pela sua utilidade no contexto desta tese que ele refor a os argumentos de Bateson 2002 e Weick 1995 sobre o impacto da informa o nova num fluxo CHOO 2003 p 241 grifos nossos a informa o redundante aquela que transmite algo que o indiv duo j sabe ou reconhece e f cil avaliar sua relev ncia e utilidade Portanto a informa o redundante pode dar confian a e reduzir a incerteza A informa o nova pode ampliar o conhecimento mas pode n o corresponder atual estrutura cognitiva do indiv duo exigindo que ele reconstrua significado e signific ncia Sem perda de conte do epistemol gico para os objetivos desta tese pode se consolidar os aspectos emocionais e situacionais do processo de cria o de significado de Choo 2003 no psicologismo cognitivo de Weick 1995 Essa s ntese ser discutida no Cap tulo 6 Conclui se nesta revis o de literatura que apesar da abund ncia de abordagens metodol gicas para tratamento da informa o desenvolvidas na academia e na ind stria n o h publica o sobre um construto metodol gico n o supervisionado para minera o e modelagem semi autom tica de conceitos relevantes em textos digitais em linguagem natural abertos com uma abordagem integrada de Intelig ncia Artificial para suportar uma praxis de Gest o do Conhecimento em contextos de Intelig ncia Competitiva nas organiza es Entretan
132. ade explicativa do modelo computacional simulado buscando se respostas para as quest es que motivaram o desenvolvimento da pesquisa Como exemplo utilizando se a vantagem da replica o do m todo de simula o computacional para repetir o processamento do modelo com inst ncias vari veis dos atributos das organiza es simuladas testou se uma situa o de simula o do tipo e se buscando se conhecer o impacto conceitual de um incremento de informa o na base textual em tempo futuro ou seja alterando se os valores das vari veis de entrada do modelo para se observar quais impactos produzem essas altera es nos resultados sa das do modelo ds Experi ncias de simula o para responder quest es estilo e se what if 92 Com o modelo experimental proposto viabilizou se portanto a simulac o de uma organiza o com suas fontes de informa o digital n o estruturadas sobre o neg cio e a descoberta de conceitos ocultos nos conte dos dessas fontes de informa o al m de testar os efeitos das mudan as nos ambientes dessa organiza o com base nas mudan as de contexto e conte dos nas fontes de informa o E assim evidenciou se ainda que numa base experimental o potencial do arsenal de Intelig ncia Artificial IA embarcado em softwares de Processamento da Linguagem Natural PLN mostrando sua utilidade nos processos de Recupera o da Informa o RI em contextos instrumentais de gest o da informa o e
133. ado Sim ProjetoPesquisa Projeto teseAprovada Sim TeseDoutorado Tese Revisar Avaliar Literatura E Teorias Abordagens Teorias Projeto de Pesquisa Insights L gicos amp Epistemol gicos Estrat gias Selecionar Estrat gias Executar Experimentos Estrat gias Descrever Concluir Metodologia Tese T T Insights eses Texto Tese Figura 4 3 Fluxo L gico da Pesquisa Fonte do autor da tese Como sugere o fluxograma da Figura 4 3 as fases de desenvolvimento conceitual do modelo experimental resultam dos estudos nas fases iniciais do projeto com avalia o de teorias e elicita o da melhor ou das melhores estrat gias e modelos de experimenta o 91 A a o Executar Experimentos corresponde pesquisa laboratorial com simula o computacional onde os textos selecionados ser o submetidos minera o de informa es para reconhecimento de padr es sint ticos A minera o de textos ser processada com softwares aplicativos de Processamento da Linguagem Natural dispon veis A a o seguinte se concentrar na descri o da metodologia considerada exitosa que ser apresentada como suporte das teses defendidas Em Propor Teses com base nos resultados da pesquisa ser o propostas teorias que sintetizam a estrutura framework conceitual do processo de Gest o da Informa o e do Conhecimento impl cito concluindo s
134. ador para An lise de Conceito Formal ToscanaJ desenvolvido em parceria na University of Queensland Austr lia e na Technical University of Darmstadt Alemanha software livre dispon vel no endere o http toscanaj sourceforge net O pre o de licenciamento do WordSmith bastante acess vel 109 e Editor de Gr ficos Conceituais CharGer desenvolvido na University of Alabama at Huntsville EUA software livre dispon vel no endereco http sourceforge net projects charger VII Impressora HP Laser Jet 1020 O ambiente computacional assim composto atendeu em geral s expectativas tanto em termos de requisitos funcionais como n o funcionais executando as tarefas de PLN com precis o aceit vel e tempos de resposta bastante satisfat rios O TreeTagger e o WordSmith se revelaram bastante velozes para o volume de textos utilizado com tempos de resposta de no m ximo poucos segundos a cada transa o ainda que suas interfaces gr ficas n o estejam no n vel de usabilidade dos melhores softwares aplicativos comerciais o TreeTagger em particular desenvolvido originalmente para Sistema Operacional Linux e interface de linha de comando tem uma interface gr fica bastante limitada em termos de recursos O autor do manual do usu rio do WordSmith apresenta o produto como um conjunto integrado de programas de computador para observa o de como as palavras se comportam em textos SCOTT 2008 p 2 Esse aplicativo tem
135. agem Natural 29 3 2 4 Minera o de Textos 35 3 2 5 An lise de Conceito Formal 36 3 3 Modelagem de Informa es Organizacionais 44 3 3 1 Modelos e Conhecimento 45 3 3 2 Modelo Entidade Relacionamento 49 3 3 3 Gr ficos Conceituais 51 3 3 4 Linguagem de Modelagem Unificada 56 3 4 Aprendizado de Ontologias 65 3 4 1 Origens 65 3 4 2 Constru o de rvores de Conceitos 68 3 5 Cria o de Significado 73 3 5 1 Conceito Sentido e Referente 74 3 5 2 Relev ncia da Informa o 76 3 5 2 1 Abordagem da Engenharia Auto informa o 76 3 5 2 2 Abordagem Ecol gica de Bateson 79 3 5 2 3 Abordagem Psicol gica de Weick e Choo 80 4 REFERENCIAL TE RICO E METODOLOGIA DA PESQUISA 85 4 1 Fundamenta o Metodol gica 85 4 2 Metodologia Experimental 88 4 2 1 Simula o Computacional 89 4 2 2 Aplica o do M todo na Pesquisa 91 4 3 Procedimentos Gerais 92 5 DADOS EXPERIMENTOS E RESULTADOS 94 5 1 Estrat gia de Recupera o da Informa o 95 5 2 Fontes de Informa o 99 5 2 1 Era pr nternet 99 5 2 2 Evoluc o da Web 101 5 2 3 Web Portais Corporativos 105 5 2 4 Identifica o e Sele o de Fontes 108 5 3 Laborat rio 109 5 4 Coleta de Dados 111 5 5 An lise Sint tica e Minera o de Textos 114 5 5 1 Metodologia de Recupera o da Informa o 114 5 5 2 An lise Estat stica 118 5 6 Contextos e Conceitos Formais 123 5 6 1 Sele o de Categorias 124 5 6 1 1 Categor
136. ais abertas das organiza es e sobre as organiza es Il Qual a sensibilidade do modelo computacional em rela o a mudan as de contexto nas vari veis de entrada Ou seja observando se e avaliando se as varia es nos resultados sa das do modelo em fun o das informa es de entrada exerc cio conhecido no jarg o da simula o experimental como quest es what if e se qual ser o poder explicativo da metodologia proposta Ill Qual o nivel de interoperabilidade sociot cnica poss vel das ontologias produzidas pela metodologia Ou qual sua capacidade de supera o das barreiras de linguagem intra organizacional e integra o de equipes de conhecimentos diversos Com isso a metodologia ser testada em sua robustez buscando se avaliar sua capacidade de minera o de informa es e elicita o de conceitos para modelagem semi 17 autom tica de sistemas nas organiza es a partir de fontes de informa es textuais dispon veis Estima se que em caso de xito na defesa da tese principal restar evidente que o arsenal de IA representa um recurso decisivo para alavancagem de meios de suporte tecnol gico a estrat gias de gest o da informa o e do conhecimento em contextos funcionais de intelig ncia competitiva nas organiza es 2 3 Premissa e hip tese A premissa na qual se embasa o desenvolvimento da tese se reporta capacidade do repert rio epistemol gico da Ci ncia da Informa o para tratamen
137. am s mudan as no ambiente de neg cios representa um diferencial importante Em rela o metodologia de minera o e modelagem de conceitos desta tese os diagramas de atividades previstos na UML poder o ser criados como detalhamento de classes e objetos do dom nio do neg cio ap s a modelagem ontol gica Como num exemplo de competi o por pre o apresentado por Fuld 2007 p 95 102 muitas vezes o detalhamento de um processo operacional de produ o mostrando se suas atividades e tarefas pode revelar os segregos da competitividade empresarial O autor utiliza uma met fora muito sugestiva para sensibilizar os gestores sobre a import ncia de se conhecer os processos da concorr ncia e compar los com os da sua pr pria organiza o enxergar as rvores para compreender a floresta 3 4 Aprendizado de ontologias 3 4 1 Origens O que se conhece como aprendizado de ontologias um conceito til para a constru o de Arquitetura da Informa o Organizacional AIO e sua praxis a Arquitetura Orientada a Servi o AOS explorando a Teoria de Conjuntos em sua ess ncia Como exemplo apresenta se a An lise de Conceito Formal WILLE 1982 como um m todo de classifica o de ontologias baseado na no o de diferencia o differentiae de Arist teles formalizado na Conex o de Galois para o aprendizado e popula o de ontologias no processo de constru o de AOS O m todo emprega abordagens l gico matem ticas l
138. an computers 180 be aware Can they offer a level of intelligence that resembles the sophisticated processes of the human brain A senior researcher in the Decision Theory and Adaptive Systems DTAS Group at Microsoft Research Heckerman is approaching these questions armed with a background in statistics medicine and artificial intelligence His work centers on using data in sophisticated ways to make computers anticipate the desires of users so they can more efficiently serve people s needs People use several phrases to describe what do including statistics machine learning and data mining but it s really all the same Heckerman says My work centers around learning from data There s a sea of data on the Web in computer databases everywhere want to take that data and gain some insight and knowledge out of it so we can make smarter decisions A boyish looking man in his early 40s Heckerman demonstrates energy and passion when discussing his work Despite the ambitiousness of his research he has the unusual gift of explaining his work in the simplest terms A couple of hours talking to him and it s clear that what most people regard as intensely challenging Heckerman sees as logical and straightforward even simple Heckerman combines data with expert knowledge to make predictions about complex problems What differentiates his work from that of traditional statisticians is that the predictive models he builds calle
139. ando se na modelagem de classes de objetos e das rela es entre as mesmas Os Gr ficos Conceituais se prestam melhor apresenta o de predicados inerentes aos objetos e agentes ou seja dos aspectos mais din micos da informa o corporativa como fluxos de atividades e tarefas dos processos A propriedade de apresenta o poliss mica dos substantivos nomes nos quadros de contextos com incid ncia de atributos em objetos utilizados na An lise de Conceito Formal permite que se construam com a UML fragmentos de modelos de classes de objetos Os modelos fragmentados apresentados nas figuras a seguir s o constru dos dentro de conceitos reticulados para mostrar como subconceitos se relacionam internamente nesses conceitos Os fragmentos de modelos est ticos de informa o constitu dos por sintagmas plurinominais que representam subconceitos dos conceitos formais reticulados geralmente podem tamb m ser representados em linguagem unificada Unified Modeling Language UML na forma dos diagramas can nicos de classes da Figura 6 2 sem as gavetas de atributos e m todos nos ret ngulos de classes por serem desnecess rios no caso Esses modelos can nicos comuns na modelagem de sistemas orientados a objetos WEILKIENS OESTEREICH 2007 sugerem que um objeto representado linguisticamente por um sintagma plurinominal pertence a uma classe conceitual e tem uma classe de atributos associada ao mesmo como uma caracter stica
140. anguage processing petabytes of information pricing algorithms research efforts risk management social network mining support for decision making support in collaboration text mining Web service workflow management e outros e componente organizacional areas of expertise area of finance areas of interest Asia strategy banking and insurance sectors branch office business category business networks business structures capability areas computing group consulting company enterprise borders field personnel FRI s China researchers Fujitsu Group hardware division HiPODS China Lab IBM Research Lab in Tokyo institute site Life Science 147 group management issues in partnership middleware in terms of business needs operations in some corner of the world partnership with IBM research facilities social network solution team T J Watson Hesearch Center Venue Tokyo e outros 6 1 1 Conceitos e estruturas est ticas de informa o Como se mencionou no Cap tulo 3 existem al m dos reticulados conceituais v rias estruturas cognitivas com visualiza o gr fica que podem ser utilizadas para modelagem da informa o tais como a Linguagem de Modelagem Unificada Unified Modelling Language UML e os Gr ficos Conceituais Os artefatos gr ficos da UML s o bastante teis para aquilo que podemos chamar de modelagem est tica da informa o relativa s estruturas da arquitetura da informa o corporativa concentr
141. antivos nomes do novo texto adicionado base pode ser resumido na seguinte f rmula matem tica F i Fo i ASe Qs onde F i frequ ncia normatizada do substantivo nome novo indexado como i Fo i frequ ncia n o normatizada do substantivo nome novo indexado como i Qs quantidade de substantivos nomes n o repetidos na base preexistente Qs quantidade de substantivos nomes n o repetidos no texto novo 192 Este modelo de sensor sem ntico testado com os dados do APENSO IV resulta em valores de Fn i conforme a Tabela 6 3 a seguir calculados somente para a faixa dos 2 5 de substantivos nomes mais frequentes O valor do fator de normaliza o Qse Qsn calculado 4 0 raz o entre 1 159 e 289 Tabela 6 3 Altera es de Posi es Relativas de Frequ ncias com Atualiza o da Base N Colet nea de Base Novo Texto Adicionado Colet nea Atualizada Substantivo Nome Freq i Substantivo Nome Fo i Substantivo Nome En i 1 Research 278 thing Research 218 2 Microsoft 256 people Microsoft 256 3 Computer 80 thing 136 4 Computing 68 Gates people 125 5 People 57 software 13 software 98 lot 12 computer 80 today 12 computing 68 Areas 50 Microsoft Technology 57 9 Information 50 10 Science 49 Systems 55 11 Software 46 Gates 52 12 Group 42 Areas 50 13 Data 37 Information 50
142. aos volumes de informa o aberta apresentados em seus portais na Web O n mero de colet neas adotado buscou compatibilizar a necessidade de uma amostragem minimamente representativa do universo das organiza es com a disponibilidade de tempo e de recursos humanos e materiais no horizonte da pesquisa para o esfor o de laborat rio considerou se portanto esse n mero satisfat rio para uma avalia o dos dados das organiza es mais representativas para o desenvolvimento da tese A lista Fortune 100 contempla apenas empresas norte americanas 9 Dados dispon veis em http money cnn com magazines fortune global500 2009 full list 108 Os testes de laborat rio com textos de artigos cient ficos mais presentes na Web invis vel tanto corroboram os resultados observados nos textos de portais corporativos na Web como suscitam algumas indaga es ulteriores interessantes voltadas para uma poss vel classifica o tipol gica de conte dos de textos em linguagem natural a partir dos par metros quantitativos de an lise adotados nos experimentos Quest es como Que tipo de texto apresenta naturalmente maior conte do sem ntico ou Quais par metros sint ticos estat sticos indicam o n vel sem ntico de um texto talvez possam ser respondidas com a metodologia de an lise conceitual proposta nesta tese 5 3 Laborat rio Como proposto na metodologia de desenvolvimento da pesquisa as atividades de coleta
143. ar a todas as organiza es como conhecimento cient fico publicado quest es ambientais quest es econ micas regulamenta o governamental etc como exemplos nos contextos do experimento tem se access for people Cambridge Lab client experience cutting edge technologies energy grids research institutes in Japan spare parts business e outros 5 6 2 Classifica o de objetos sintagm ticos Os objetos sintagm ticos obtidos na minera o de texto para modelagem de conceitos nem sempre representa uma atividade trivial devido ao n vel de abstra o dos objetos Embora se possam desenvolver crit rios de classifica o ao longo de uma etapa de treinamento da equipe de engenharia do conhecimento com regras est veis e satisfat rias inicialmente o problema da classifica o se apresenta de modo evidente exigindo uma solu o Esse tipo de problema denominado processo de elicita o do conhecimento SCHREIBER et al 2000 ou ainda de socializa o do conhecimento NONAKA e TAKEUCHI 1997 tamb m se apresenta em outras abordagens de modelagem de conceitos com uso de quaisquer outros m todos de classifica o como relatado por Schreiber et al 2000 p 187 214 Elicita o do conhecimento o processo de obten o dos dados necess rios para a modelagem do conhecimento Existe uma variedade de t cnicas de elicita o entrevistas an lise de protocolo laddering ordena o de conceitos e gra
144. ara pesquisas ulteriores tais como a gram tica do sistema DIALOGIC que utilizada no projeto TACITUS composta de aproximadamente 160 regras de estruturas frasais do idioma ingl s com um construtor que expressa as restri es de uso da regra e um tradutor para produ o do formalismo l gico 9 KBNL Knowledge Based Natural Language Processing no idioma original 33 Church e Rau 1995 antecipam num cen rio vislumbrado em meados dos anos 1990 algumas aplica es comerciais de sistemas de processamento de linguagem natural como o processamento de texto a publica o de conte dos digitais e a gest o da informa o As aplica es de PLN na gest o da informa o mais atrativas para os autores seriam recupera o da informa o categoriza o de documentos extra o de dados estruturados de textos em linguagem natural e no caminho inverso gera o de textos em linguagem natural a partir de dados estruturados Contemporaneamente King 1996 apresenta uma revis o das metodologias de avalia o de sistemas de processamento de linguagem natural influenciada segundo a pr pria autora pelo trabalho dos Expert Advisory Groups for Language Engineering Standards EAGLES iniciado em 1992 O framework de avalia o dos grupos EAGLES originou o padr o ISO 9126 de qualidade de software Contudo as metodologias de avalia o poca eram muito variadas assim como o escopo dos sistemas avaliados dificultand
145. arece ser ou verdadeira ou falsa mas nenhuma das express es que s o ditas sem 125 qualquer combina o como por exemplo homem branco corre vence verdadeira ou falsa ARISTOTELES SANTOS 1995 p 39 A categoria fundamental de Arist teles para a classificac o das coisas do mundo a de subst ncia que assim definida pelo fil sofo ARIST TELES SANTOS 1995 p 39 40 Subst ncia aquilo a que chamamos subst ncia de modo mais pr prio primeiro e principal aquilo que nem dito de algum sujeito nem existe em algum sujeito como por exemplo um certo homem ou um certo cavalo Chamam se subst ncias segundas as esp cies a que as coisas primeiramente chamadas subst ncias pertencem e tamb m os g neros dessas esp cies Por exemplo um certo homem pertence esp cie homem e animal o g nero da esp cie por conseguinte homem e animal s o chamados subst ncias segundas Das subst ncias segundas a esp cie mais subst ncia do que o g nero pois est mais pr ximo da subst ncia primeira Pois se tivermos de dizer de uma subst ncia primeira o que ela ser mais informativo e mais adequado indicar a esp cie do que indicar o g nero Por exemplo de um certo homem ser mais informativo dizer que um homem do que dizer que um animal pois o primeiro mais pr prio de um certo homem enquanto o segundo mais comum e para dizer o que uma certa rvore ser
146. ares Objetivamente os modelos mentais ou modelos conceituais desenvolvidos nesta tese se fundamentam em teses da Intelig ncia Artificial que se encontram contemporaneamente tamb m no discurso de pesquisadores de outras disciplinas tais como a educa o Com o advento da era da informa o digital percebe se que a Intelig ncia Artificial passa a ser tratada como algo natural sem preconceitos na medida em que alguns de seus produtos mais evidentes s o incorporados ao padr o sociot cnico do dia a dia das pessoas como sistemas de informa o computacional embarcados em m quinas e aparelhos eletr nicos diversos autom veis microcomputadores termostatos telefones celulares etc Ontoria De Luque e G mez 2006 p 41 por exemplo colocam o tema dos modelos mentais com a seguinte argumenta o grifos nossos a origem dos mapas mentais Buzan 1996 44 proveniente dos estudos sobre a mem ria quando se teve consci ncia de que associa o e nfase s o dois fatores fundamentais para a perman ncia da lembran a e sua evoca o posterior O agrupamento de conceitos e id ias cria estruturas cognitivas que na din mica do pensamento relaciona se entre si ou com outras estruturas novas Outro fato a ser ressaltado como origem dos mapas mentais a busca de uma t cnica que ajude a memorizar e que posteriormente evoluiu para uma t cnica do pensamento Buzan 1996 168 Igualmente ressalta se outro fato como refere
147. as de descoberta de conhecimento Como estado da arte a autora menciona os esfor os empreendidos desde 1996 nas comunidades de An lise de Conceito Formal e de Gr ficos Conceituais para a constru o de formalismos de representa o do conhecimento Uma combina o de ACF e Gr ficos Conceituais n o apenas outro formalismo ontol gico porque ela tem fundamento filos fico Wille 2000 percebe a l gica e o racioc nio e argumenta o humana como uma tr ade Kantiana de conceitos ju zos e conclus es A meta utilizar ACF para matematiza o dessas tr s doutrinas filos ficas num framework de L gica Contextual PREDIGER 1998 Enquanto ACF utilizada para matematiza o de conceitos Gr ficos Conceituais s o utilizados para matematiza o de ju zos Uma combina o de Gr ficos Conceituais ACF e L gica 43 Descritiva poder ent o ser utilizada para matematizar conclus es Wille encara isso como uma continua o da l gica de signos e classes de Boole WILLE 2000 e 2004 Mas em contraste a Boole que vislumbrara um conjunto ou classe Universal a ACF focada em contextos formais que s o finitos na maioria das aplica es GANTER e WILLE 1999 e que evitam algumas das confus es causadas pela assun o da universalidade PRISS 2005 p 16 4 3 Modelagem de informa es organizacionais O uso de modelos para explicar os fen menos do mundo com a percep o cient fica representa algo inerente ao pr p
148. as do jogo conduzir as atividades coordenadas por um facilitador e avaliar as estrat gias apresentadas pelos grupos concorrentes atribuindo ao final uma men o de compet ncia a cada um pela for a da estrat gia apresentada 137 Como exemplo Fuld 2007 apresenta o contexto e os resultados de um conhecido jogo de guerra realizado por alunos da Harvard University e do Massachusetts Institute of Technology MIT envolvendo poss veis estrat gias competitivas das empresas Google Yahoo America On Line AOL uma divis o do grupo de m dia Time Warner e Microsoft O bilion rio mercado em quest o era o de conte dos na Web composto por produtos e servi os como busca inteligente plataformas tecnol gicas e de redes de usu rios portanto e disponibiliza o de conte dos espec ficos para os clientes como os de economia al m da an lise de custos e precos entre outros fatores de neg cio As cinco for as de Porter comentadas por autores como Fuld 2007 e Greenwald e Kahn 2005 s o e competi o entre os jogadores atuais e amea a de novos entrantes e amea a de substitutos e poder dos compradores e e poder dos fornecedores O modelo dos quatro componentes passa pela an lise de 1 metas futuras 2 hip teses 3 estrat gia e 4 capacidade As metas constituem a motiva o objetiva dos executivos em termos de resultados colimados para a organiza o no tempo as hip teses s o as cren as que uma orga
149. assifica o de objetos como abstraction for the business artifacts aftermarket services bandwith availability cross industry Supply Chain Operations Reference Model development of service delivery solutions e government services information services hub e outros nas categorias de Arist teles requer a an lise de v rios n veis hier rquicos de composi o sint tica e sem ntica e at o uso de dicion rio algo que certamente consumir uma 127 fra o de tempo al m do razo vel em tarefas de classifica o manual de milhares de objetos O desenvolvimento de algoritmos de classifica o autom tica ou semi autom tica desse tipo de objeto textual com uso de softwares inteligentes parece uma tarefa n o trivial com rela o custo benef cio pouco atraente no contexto motivos pelos quais foi descartada Outro aspecto negativo das categorias de Arist teles como m todo de classifica o neste contexto se refere pouca intuitibilidade no aprendizado sobre os agrupamentos conceituais de objetos como resultados da An lise de Conceito Formal 5 6 1 3 Categoriza o da engenharia do conhecimento Engenharia do Conhecimento um termo utilizado nas comunidades de Engenharia de Sistemas e Ci ncia da Computa o para contextualizar a disciplina que se ocupa do ambiente epistemol gico de desenvolvimento de sistemas computacionais nos quais o racioc nio inteligente e o conhecime
150. ation as interlingua Proceedings of the 4 International Conference on Conceptual Structures ICCS 96 Sidney Australia 1996 ETZIONI O CAFARELLA M DOWNEY D POPESCU A M SHAKED T SODERLAND S WELD D YATES A Methods for domain independent information extraction from the Web an experimental comparison In Proceedings of the 19 National Conference on Artificial Intelligence AAAI 2004 p 391 398 EVANS R A framework for named entity recognition in the open domain n Proceedings of the International Conference on Recent Advances in Natural Language Processing RANLP 2003 p 137 144 EVENS Martha Walton Ed Relational models of the lexicon representing knowledge in semantic networks Cambridge University 1988 EXAME Estudo exame cart es Edi o 968 n 9 ano 44 19 maio 2010 FAURE D NEDELLEC C A corpus based conceptual clustering method for verb frames and ontology n VELARDI P Ed n Proceedings of the LREC Workshop on Adapting Lexical and Corpus Resources to Sublanguages and Applications 1998 p 5 12 FAYYAD Usama M PIATETSKY SHAPIRO Gregory SMITH Padhraic RAMASAMY Uthurusamy Advances in knowledge discovery and data mining Menlo Park CA AAAI MIT Press 1996 FERNEDA Edberto Redes neurais em sua aplica o em sistemas de recupera o de informa o Ci ncia da Informa o Bras lia v 35 n 1 p 25 30 jan abr 2006 FERRER Florencia LIMA Christia
151. autor da tese O que esse simples exerc cio com o m todo de minera o de conceitos proposto sugere A resposta como os conceitos utilizados pelos seres humanos s o em sua maioria relacionados entre si no discurso pode se partir de conceitos semente para buscas de conceitos correlatos descobrindo se assim conceitos mais complexos por composi o vertical de conceitos construindo se conceitos em pilha como no caso de Repercuss o do Fim do Duop lio no Setor de Cart es e conceitos mais ricos em significados por associa o horizontal com outros conceitos como em Fronteira de Cart es O segundo sintagma mais frequente com uso do substantivo cart o ou cart es setor de cart es est associado no texto da reportagem ao conceito mais complexo descoberto nessa minera o que exprime por si s a id ia central sobre o fen meno de mercado em estudo a dos poss veis impactos do fim do duop lio de cart es de cr dito e d bito sobre o mercado Com fragmentos de textos representando informa o conceitual relativamente simples sobre um contexto de neg cio mineradas de modo semi autom tico o engenheiro do conhecimento 152 poder elaborar composic es conceituais mais complexas e ricas em significados como se aplica no caso o princ pio da intelig ncia emergente da Intelig ncia Artificial baseada na natureza Entre os conceitos modelados na Figura
152. b invis vel provavelmente dispon vel apenas para os usu rios na rede interna Intranet do Fujitsu Research Institute FRI trata se claramente de uma linha de desenvolvimento competitivo da organiza o O termo innovation inova o permite essa conclus o pois inova o em servi os com agrega o de valor ao cliente uma necessidade competitiva ditada pelas necessidades do mercado em constante muta o A simples men o do interesse da FRI no nicho de servi os inovadores para clientes 8 As buscas de aprofundamento relatadas neste cap tulo se deram de 3 a 13 de junho de 2010 Observe se que nesse tipo de busca o algoritmo do Google precisa encontrar endere os com conte dos que contenham os dois sintagmas adotados como argumentos restringindo assim os resultados 160 que operam com distribui o f sica de produtos apoiando com sua pesquisa e desenvolvimento as opera es comerciais da holding Fujitsu Corporation deve servir para acender uma luz amarela no painel de observa o de uma organiza o que compete com a FRI no mercado algo como um alerta antecipado A constru o de um conhecimento de primeira ordem ou preliminar com mais esse pequeno texto recuperado recursivamente da Web torna se um processo de resultado imediato pois o texto evidencia informa o relevante como not cia no contexto O ltimo est gio do modelo anal tico hol stico de Choo 2003 relativo ao processo de
153. c pio assume que a intelig ncia pode emergir da intera o complexa entre elementos mais simples como no caso dos pontinhos da pintura que de uma perspectiva adequada mostra ao observador uma rica paisagem impressionista Outros exemplos similares desse fen meno cognitivo podem ser o mestre de xadrez que numa partida enxerga um cen rio vantajoso do seu jogo numa certa sequ ncia de jogadas frente enquanto no presente nada mais se pode observar que uma posi o est tica pouco alentadora no tabuleiro o astr nomo que l um mapa celeste a partir do conjunto das posi es de algumas estrelas chave isoladas uma sequ ncia de bits que codifica uma palavra em linguagem natural Outra parte da argumenta o de Fuld 2007 p 16 esclarece algo sobre o que procurar nas fontes de informa o digitais e talvez tamb m sobre o como procurar as informa es essenciais em textos Desenvolver intelig ncia competitiva semelhante a criar uma pintura pontilhada Seu objetivo n o criar uma imagem perfeita mas uma imagem representativa da realidade como Seurat fez ao criar sua cena serena com o m nimo de pontilhados Afaste se alguns passos da pintura de Seurat e voc sentir como se estivesse sentado na margem do rio naquele dia quente e vagaroso de ver o 5 1 Estrat gia de recupera o da informa o Com inspira o na met fora impressionista de Fuld 2007 e na estrat gia de uso de sintagmas nominais como in
154. cados mais completos conceitos modelados anteriormente com a UML Estima se que sua aplica o se apresente til no esclarecimento de modelos mentais de conceitos abstratos ou para se elicitar processos e dados para modelagem de sistemas de informa o como no exemplo da Figura 1 3 O construto epistemol gico sintetizado no processo do Quadro 4 1 prop e portanto um processo de Gest o da Informa o util para Gest o do Conhecimento em contextos organizacionais de Intelig ncia Competitiva 4 2 Metodologia experimental O objetivo da experimenta o simular um processo de extra o de informa es conceituais de documentos textuais digitais como ilustrado no Quadro 4 1 para modelagem de sistemas organizacionais numa abordagem de engenharia reversa da linguagem natural para modelos mentais e estruturas conceituais que possam representar o conhecimento sist mico das organiza es Com essa abordagem pretende se mostrar experimentalmente como se poder 88 utilizar o crescente volume de informa es digitais dispon veis das e sobre as organiza es para se avan ar na automa o dos processos de remodelagem de sistemas e reengenharia com uso intensivo da informa o e suas tecnologias 4 2 1 Simulac o computacional Os m todos e t cnicas de extra o e mapeamento da informa o e do conhecimento organizacional que emulam caracter sticas do c rebro humano Intelig ncia Artificial IA para instrumenta
155. cco 1998 LUHN H P The automatic creation of literature abstracts BM Journal of Research n 2 v 4 p 159 165 1958 LUHN H P A statistical approach to mechanised encoding and searching of library information IBM Journal of Research and Development n 1 p 309 317 1957 LUKOSE Dickson DELUGACH Harry KEELER Mary SEARLE Leroy SOWA John Eds Conceptual structures fulfilling Peirce s Dream Proceedings of the Fifth International Conference on Conceptual Structures ICCS 97 Seattle Washington USA August 1997 LUNA REYES Luis F ANDERSEN David F RICHARDSON George P PARDO Theresa A CRESSWELL Anthony M Emergence of the governance structure for information integration across governmental agencies a system dynamics approach n The Proceedings of the 8 Annual International Digital Governmental Research Conference 2005 M DCHE A STAAB S Discovering conceptual relations from text In Proceedings of the 14 European Conference on Artificial Intelligence ECAI 2000 p 321 325 M DCHE A STAAB S Ontology learning for the Semantic Web IEEE Intelligent Systems v 16 n 2 2001 p 72 79 MAGLIO Paul P et al Service systems service scientists SSME and innovation Communications of the ACM v 49 n 7 jul 2006 MAIA Fl via Leitor contempor neo Entrevista concedida por Maria Zilda da Cunha especialista em literatura infantil e juvenil n Correio Braziliense Bras lia 30 maio 2
156. ceito de busca inteligente neste caso se refere tentativa de igualar o desempenho humano numa dimens o chave desse empreendimento utilidade num contexto Com o oceano de informa o digital dispon vel na atualidade o modelo de busca ideal ser certamente aquele composto por recursos de busca ultraveloz e cir rgica retornando apenas um m nimo de informa o com o m ximo de precis o poss vel no contexto Com esses requisitos funcionais os filtros dos softwares de busca precisam ser cada vez mais velozes e precisos outra importante linha de pesquisa na ci ncia e tecnologia da informa o que consome quantias cada vez mais fant sticas de recursos anualmente nas grandes empresas do mercado O problema de engenharia esmiu ado de modo mais did tico por Bates 1999 p 1 048 com grifos nossos com os seguintes argumentos Em conseq ncia da complexidade ling stica psicol gica cognitiva social e t cnica da recupera o da informa o cada aumento no tamanho da fonte de informa o ou base de dados requer solu es diferentes escalabilidade um problema fundamental nesse campo Eu creio que de um ponto de vista um historiador mostrar que a explos o da informa o conosco desde a inven o da impress o tem direcionado a maioria das maiores inova es na organiza o e no acesso informa o Cada vez que a cole o cresce em m dia para um novo n vel um novo m todo de acesso
157. cesso heur stico de extra o de conhecimento til a partir de massas de dados preexistentes nas organiza es geralmente armazenadas em bancos de dados de sistemas computacionais Ebecken Lopes e Costa 2005 conceituam minera o de textos como um conjunto de t cnicas e processos que descobrem conhecimento inovador nos textos com desdobramentos mais atuais no mundo dos neg cios a partir da descoberta de novas dimens es nas informa es dispon veis nas empresas Contudo observando se a literatura da Ci ncia da Informa o desde seus prim rdios percebe se que os tecn logos da Ci ncia da Computa o trilharam caminhos diferentes para alcan ar praticamente o mesmo objetivo da comunidade da Ci ncia da Informa o num per odo anterior De um modo geral as tecnologias teis para aquisi o de conhecimento em qualquer atividade humana a partir dessas massas de informa es brutas dados e textos principalmente derivam de campos da pesquisa l gico matem tica e estat stica e da Intelig ncia Artificial IA O corpo de conhecimentos de IA se baseia conceitualmente nos conhecimentos de outras disciplinas tais como Biologia Ci ncia da Computa o Estat stica Neurologia e Psicologia E o que de fato se produz no campo da IA a cola a engenharia de sistemas para integra o e combina o de conceitos dessas disciplinas subjacentes em aplica es complexas que exigem abordagem multidisciplinar Essas metodologia
158. cional que eventualmente me dispensaram Cito a sempre prestimosa aten o dispensada por Jucilene Gomes e Martha Ara jo diligentes servidoras p blicas que mant m a Secretaria do Programa de P s Gradua o em Ci ncia da Informa o da Faculdade de Ci ncia da Informa o da Universidade de Bras lia PPGCINF FCI UnB sempre ativa e operante em qualquer tempo a despeito das in meras condi es institucionais restritivas que infelizmente conspiram contra a qualidade da gest o no setor p blico no Brasil E finalmente agrade o aos doutores com perfis multidisciplinares e transdisciplinares que est o contribuindo decisivamente para o desenvolvimento evolutivo da Ci ncia da Informa o na FCI UnB pela sua coragem determina o e entusiasmo que muito me contagiaram nos ltimos anos e me estimularam para elabora o desta tese O seu esfor o n o ser em v o pois com faculdades multidisciplinares e transdisciplinares teremos certamente seres humanos dotados de intelectos mais holistas no futuro com uma mais larga capacidade de compreens o dos temas cient ficos e tecnol gicos atuais e dos enormes desafios que se apresentam humanidade nesta era de mudangas t o velozes e impactantes RESUMO CAPUANO Ethel Airton Minerac o e Modelagem de Conceitos como Praxis de Gest o do Conhecimento para Intelig ncia Competitiva Bras lia Universidade de Bras lia Tese de Doutorado em Ci ncia da Informa o Com o cre
159. coluna A A maior colet nea digital resultante a da empresa Sun Microsystems com 559 5 MB megabytes e a menor a do Bank of America com 16 1 MB O bloco seguinte mais direita denominado Palavras cont m dados sobre coluna B a quantidade de palavras encontradas em cada colet nea considerando se inclusive as repeti es de palavras coluna C a quantidade de palavras distintas encontradas ou tipos sem repeti o e coluna D a rela o de propor o entre a quantidade de palavras distintas e a quantidade total de palavras encontradas em cada colet nea em percentual par metro denominado em PLN rela o tipo palavra type token As colunas do bloco de dados Substantivos mostram a quantidade de substantivos ou nomes com repeti o em cada colet nea coluna E a quantidade de substantivos distintos coluna F a quantidade de substantivos distintos que aparecem na composi o de sintagmas plurinominais coluna G a rela o entre o n mero de substantivos distintos e o n mero de palavras distintas coluna H e a rela o entre o n mero de substantivos distintos compondo sintagmas e o n mero de substantivos distintos O ltimo bloco de dados direita nesse quadro mostra a quantidade de sintagmas plurinominais distintos coluna J e a rela o entre esse n mero e a quantidade de substantivos distintos coluna K O quadro ainda most
160. conceitos de indexa o extra o de caracter sticas sumariza o clustering agrupamento e categoriza o iii valida o das descobertas e iv compara o de ferramentas de minera o de textos dispon veis no mercado E concluem com uma observa o de Zanasi que fundamenta o problema apresentado neste trabalho de pesquisa as empresas redescobriram suas informa es j armazenadas em textos e est o utilizando essas informa es como uma vantagem competitiva em rela o aos seus concorrentes A minera o de textos apresentou os principais recursos para que a intelig ncia pudesse ser efetivada ZANASI 2000 EBECKEN LOPES COSTA 2005 p 370 O artigo de Silva Prado e Ferneda 2002 elucidativo em rela o ao desenvolvimento de metodologias e tecnologias para minera o de textos mostrando os problemas de prioriza o de esfor os e interesses algo discrepantes entre a academia e a ind stria Embora a an lise dos dois grupos de cientistas da informa o observados por Saracevic 1999 permita deduzir se que as conex es l gico cognitivas entre minera o de textos e intelig ncia competitiva passando pelo impl cito conceito de gest o do conhecimento ainda sejam ignoradas por expressiva parcela da comunidade da Ci ncia da Informa o os exemplos de aplica es pr ticas no dia a dia das organiza es est o se tornando cada vez mais evidentes O caso descrito por Ebecken Lopes e Costa 2005
161. conhecimento Com uma not vel bagagem acad mica no mundo da Intelig ncia Competitiva no Brasil verdadeira pioneira nessa rea do conhecimento ainda em constru o sua participa o em mais esta jornada acad mica jamais ser esquecida Ao Prof Dr Ulf Gregor Baranow com seu not vel conhecimento ling stico agrade o pelo seu interesse e disposi o em participar da banca acrescentando valorosa cr tica tese apresentada e aos seus desdobramentos futuros A sua presen a real a a dimens o ling stica do experimento desenvolvido e suas implica es epistemol gicas no contexto da minera o de conceitos como praxis de gest o do conhecimento para Intelig ncia Competitiva E Prof Dra Lillian Maria Ara jo de Rezende Alvares agrade o pelo seu interesse disposi o e aten o nos ltimos meses desta jornada quando a leitura e avalia o das ltimas vers es do texto pelos fisicamente mais pr ximos se tornaram de grande valor na exata medida da maior efici ncia da intera o pessoal no aperfei oamento dos aspectos de comunica o das ideias centrais da tese As suas impress es como rec m doutorada em Ci ncia da Informa o na Faculdade de Ci ncia da Informa o da Universidade de Bras lia FCI UnB s o de grande valia como refer ncia qualificada para a avalia o de nosso esfor o Agrade o ainda aos colegas discentes e demais professores e funcion rios da FCI UnB pelo apoio emocional cognitivo e situa
162. conserto descobre se a classe conserto com as classes atributos mec nico e motor 1 Texto em Linguagem Natural O mec nico conserta o motor do autom vel 2 Texto Etiquetado O DT mec nico NN conserta VB 0 DT motor NN do IN DT autom vel NN Figura 1 2 Estruturas Sint ticas de Texto em Linguagem Natural Fonte do autor da tese As classes representando a es e n o objetos como conserto s o importantes porque se referem geralmente a servi os executados no interior das organiza es por uma unidade produtiva para outra e pelas organiza es para sua clientela no caso o conserto de um componente de um autom vel como o motor uma transa o ou servi o de neg cio da organiza o no mercado Ampliando se o modelo mediante uma pesquisa ontol gica com apoio de um dicion rio idiom tico com sin nimos descobre se ainda que a classe de objetos mec nico uma inst ncia de uma classe mais geral que pode ser denominada empregado e que continuando a subir na rvore hier rquica dessa ontologia idiom tica essa classe empregado pertence a uma outra classe ainda mais primitiva a classe pessoa A classe conserto com uso de dicion rio tamb m pode representar instanciar um tipo de a o mais abstrata ou uma classe mais gen rica denominada a o ou transa o no caso Outras estruturas sint ticas uteis par
163. contradas pois um n mero menor de caracter sticas comuns exigido Galois formalizou a conex o inversa de Arist teles no que se conhece por Conex o de Galois WILLE 1982 GANTER STUMME e WILLE 2005 Conforme a teoria da An lise de Conceito Formal ACF os objetos s o representados como objetos formais e suas caracter sticas como atributos formais CIMIANO 2006 Objetos e caracter sticas extra dos do texto em linguagem natural s o dispostos numa matriz de incid ncia cruzando objetos com as respectivas caracter sticas incidentes nas colunas de atributos gerando uma matriz com dados bin rios de relac es de incid ncia entre objetos e caracter sticas conforme a Tabela 3 1 Entretanto essa matriz de rela es de incid ncia ainda n o apresenta conceitos formais conforme o m todo mas apenas um contexto formal e a raz o disso que existem atributos que n o apresentam rela o de incid ncia com objetos Como exemplo de aplica o em um contexto Cimiano 2006 p 57 observa que nos atributos e rela es de incid ncia da Tabela 3 1 os atributos s o constru dos a partir de verbos que acompanham sintaticamente os objetos nos textos estudados rela es de pares de termos com estrutura verbo objeto definindo bookable como o atributo comum a todos os objetos interpretado como o atributo reserv vel rentable alug vel como atributo comum aos objetos apartamento carro e bicicleta driveable dirig vel
164. correlatas s o abordadas por Al Neimat 2007 Paula Filho 2005 e Pressman 1995 entre outros ainda que sem solu es propostas no contexto que se apresenta E um terceiro ponto de natureza estrutural nas organiza es complexas que os processos de modelagem de Sls geralmente requerem informa es e conhecimento dos operadores e gerentes de m dia hierarquia que s o utilizados no dia a dia das equipes de ch o de f brica e de ger ncia consistindo o trabalho de modelagem em grande parte na elicita o de requisitos a partir do conhecimento t cito desse estamento e de conte dos documentais dispon veis mas desestruturados De pontos de vista mais instrumentais sobre minera o de dados e minera o de textos Fayyad Piatetsky Shapiro Smyth e Ramasamy 1996 observam que a busca de padr es em 2 Anglicismo elaborado para translitera o do termo elicitation 26 dados brutos tem sido identificada com terminologias variadas tais como descoberta de conhecimento em bases de dados descoberta de informa es coleta de informa es arqueologia de dados e processamento de padr es de dados Ebecken Lopes e Costa 2005 se concentram na defini o e an lise dos contextos de uso da minera o de textos nas organiza es Como cen rio sociot cnico gen rico esses autores observam que todos os tipos de textos que comp em atualmente o dia a dia de empresas e pessoas s o produzidos e armaze
165. curso da heran a considerado um dos pontos fortes na metodologia de modelagem de sistemas orientada a objetos OO permitindo que uma subclasse utilize uma fun o prevista na superclasse ao qual se relaciona por generaliza o resultando em economia de esfor o de Forma Geom trica origem Ponto mover posi o Ponto redimensionar raz o Real display programa o Ret ngulo C rculo Pol gono largura Dist ncia raio Dist ncia posV rtice Lista de Ponto Itura Dist nci z Susanne le redimensionar razao Real redimensionar razao Real redimensionar razao Real display display display Figura 3 7 Generaliza o entre Classes Fonte BOOCH RUMBAUGH e JACOBSON 2005 A Figura 3 8 mostra uma representa o pict rica dos relacionamentos estruturais t picos de um modelo ontol gico de sistema computacional com uso da UML O exemplo apresenta as classes Escola Departamento Aluno Curso e Instrutor e dois tipos b sicos de relacionamentos entre si agrega o e associa o A classe Escola uma entidade maior que integrada pelas classes Aluno e Departamento caracterizando se esse tipo de agrega o com m diamante paralelogramo na extremidade da linha de associa o pr xima classe Escola O modelo tamb m indica que a classe Instrutor integra a classe Departamento ou seja um instrutor
166. d 2000 p 14 O uso do logaritmo para se obter uma medida de informa o n o foi uma escolha arbitr ria Lembre se que log 1 0 e que log x cresce medida que x 76 decresce de um para zero Assim se a probabilidade de um evento baixa a quantidade de auto informa o associada alta se a probabilidade de um evento alta a informa o associada baixa E mesmo se ignoramos a defini o matem tica de informa o e simplesmente usamos a defini o que usamos na linguagem do dia a dia isto faz algum sentido intuitivo O latido de um c o durante um assalto um evento de alta probabilidade e por isso n o cont m muita informa o Entretanto se o c o n o late durante o assalto este um evento de baixa probabilidade e cont m um bocado de informa o Contudo a associa o entre as defini es de informa o sob os pontos de vista da auto informa o e da sem ntica deve ser estabelecida conhecendo se o contexto e suas implica es epistemol gicas Como exemplo pode se questionar numa compara o entre uma s rie de s mbolos da linguagem natural distribu dos randomicamente e um texto com discurso estruturado qual dos dois conjuntos de s mbolos apresenta valor mais alto de auto informa o A resposta a essa quest o deve seguir logicamente a resposta de uma quest o mais b sica no modelo matem tico Qual dos dois conjuntos de s mbolos mais prov vel ocorrer na comunica o ent
167. d Bayesian networks capture cause and effect relationships about the world The implications of Heckerman s research are enormous Already his work is helping people eliminate junk mail from their e mail in boxes and easily obtain a sophisticated level of computer technical support without placing a phone call It is also enabling businesses to better target customers by predicting the habits of computer users who browse or shop online While his research has far reaching implications for how computers will be used in the future the underlying goal for all of Heckerman s research is to build intelligence into the computer to make it a far more useful tool than it is today The idea is that when you use your machine it will form guesses about what you re trying to do and help you Heckerman says It will be like having a butler Essa informa o confirma por outro lado o que se observou nos conceitos das Figuras 6 14 e 6 15 e na experi ncia dos jogos de guerra relatados por Fuld 2008 sobre as mais prov veis estrat gias a serem desenvolvidas futuramente pela Microsoft para manter seu poder competitivo no mercado Ou seja pode se concluir que a Microsoft dever continuar a concentrar a ess ncia de sua estrat gia nos microcomputadores pessoais de milh es de usu rios de seu Sistema Operacional Windows pelo mundo afora agregando inova es como as vislumbradas por Heckerman a cada vers o para reten o do interesse de seus cli
168. da a realidade Esta relativiza o das express es ling sticas quanto ao conhecimento est presente tamb m na obra de Saussure 2002 p 23 versando sobre a natureza do objeto Ser que a ling stica encontra diante de si como objeto primeiro e imediato um objeto dado um conjunto de coisas evidentes como o caso da f sica da qu mica da bot nica da astronomia etc De maneira alguma e em momento algum ela se situa no extremo oposto das ci ncias que podem partir do dado dos sentidos Uma sucess o de sons vocais por exemplo mer m e r talvez uma entidade que regressa ao dom nio da ac stica ou da fisiologia ela n o de jeito nenhum nesse estado uma entidade ling stica Uma l ngua existe se a m e r se vincula uma id ia Essas observa es de Saussure tamb m se relacionam com os jogos de linguagem de Wittgenstein 2001 p 7 Ser poss vel dizer se Na linguagem temos diferentes tipos de palavras Entre as fun es da palavra tijolo e da palavra bloco existem mais semelhan as que entre as fun es de tijolo e d Mas como agrupamos palavras em tipos depender do objetivo da classifica o e de nossa pr pria tend ncia 126 f cil imaginar se uma linguagem consistindo somente de ordens e respostas em batalha Ou uma linguagem consistindo somente de quest es e express es para se responder sim e n o E inumer veis outras E
169. da minera o conceitual Cap tulo 6 como recurso adicional ao m todo da An lise de Conceito Formal 98 5 2Fontes de informa o Considerando que a Intelig ncia Competitiva se prop e ao estudo e utiliza o de informa es abertas de acesso p blico portanto l cito para alcan ar seus objetivos nos ambientes das organiza es a identifica o avalia o e sele o de fontes de informa o s o atividades primordiais a serem desenvolvidas em seus processos constitutivos O tema fontes de informa o em particular representa uma rea de pesquisa com significativa representatividade na Ci ncia da Informa o reportando se aos fundamentos epistemol gicos dessa rea do conhecimento 5 2 1 Era pr Internet Fuld 2007 p 127 128 relata sua experi ncia de busca da informa o de neg cios na era pr Internet mostrando como esse tipo de informa o se encontrava dispon vel Em rela o sua particular necessidade de informa o o conceito de Internet n o foi criado nos anos 90 com o lan amento da World Wide Web e dos browsers que tornaram a rede acess vel Esta nasceu em 4 de junho de 1927 em Boston Massachussetts com a inaugura o da Baker Library no novo campus da Harvard Business School localizado ao lado do rio de Cambridge George Fisher Baker o banqueiro de Nova York de 87 anos doou US 5 milh es para sua constru o Ele acreditava que essa biblioteca de neg cios que foi
170. de alarme apenas uma inst ncia da classe Sistema com o atributo de alarme gerenciamento de sistemas uma inst ncia da classe Gerenciamento com o atributo de sistemas e pesquisas de Heckerman algo que pertence a uma pessoa de nome Heckerman entendendo se tamb m que Pesquisa de Heckerman um objeto que tem um token atributo denominado Pesquisa Outra motiva o para a cren a nesta tese que a metodologia proposta possa ser utilizada em outros idiomas a argumenta o de Werner 1988 p 145 Os trabalhos de Hamill 1978 Hutchins 1980 e outros est o acumulando evid ncias no sentido que a l gica humana a mesma em qualquer lugar E tudo isso parece dar cr dito para a id ia que o n vel conceitual mais fundamental mais similar de linguagem para linguagem ou de cultura para cultura e talvez por isso tamb m mais simples 200 Werner 1988 p 147 comentando sobre sistemas especialistas tamb m apresenta uma pista importante para se avaliar uma metodologia de automa o dessa natureza em quest es de escalabilidade de processamento de volumes de informa o e conceitos a m quina deve prover toda informa o que um usu rio humano requisitar Ao mesmo tempo o usu rio deve ser alertado pelo sistema especialista sobre outros tipos de informa o pertinentes ao t pico de indaga o que se pode tamb m possuir O principal problema que eu
171. de relacionamento entre os conceitos tomando se apenas os sintagmas relativos aos 2 5 de substantivos mais frequentes em cada contexto Figura 6 6 Reticulado de Conceitos do Contexto Fujitsu Research Fonte do autor da tese Observa se na Figura 6 6 que no cruzamento intensional dos atributos Modelo de Tarefa Modelo de Agente e Modelo de Insumo e Produto aparece apenas um objeto sintagm tico c rculo mais direita e mais embaixo no reticulado Conforme a teoria da An lise de Conceito Formal esse conceito herda atributos gerais que se referem a tarefas agentes e insumo e produto compondo um conceito que mais espec fico que seus conceitos antecessores na linhagem gen tica do reticulado como os conceitos envolvendo apenas tarefa e agente com apenas um objeto instanciando a classe e tarefa e insumo e produto com oito objetos Esse tipo de conceito com tr s atributos intensionais semanticamente rico com informa es que podem ser modeladas de modo a evidenciar estruturas de processos pap is e insumos e produtos envolvidos nos contextos organizacionais Com a estrutura conceitual do reticulado e os sintagmas com substantivos mais frequentes obtem se um construto informacional com capacidade para amenizar sen o superar os 154 problemas dos sistemas conceituais apontados por Frawley 1988 p 335 372 na repres
172. de ser considerado precursor do conceito de PLN deveria ocupar um lugar menos perif rico na IA gra as ao pioneirismo de Winograd 1972 e relacionara pelo menos quatro benef cios dessa simbiose WILKS 1975 p 130 131 i nfase em estruturas de armazenamento complexas em sistemas de compreens o da linguagem natural frames se o termo agradar MINSKY 1974 ii nfase na import ncia do mundo real conhecimento indutivo expresso nas estruturas mencionadas em i iii nfase na fun o comunicativa de senten as em um contexto como encontrar a leitura correta num contexto para uma senten a em oposi o vis o ling stica padr o para a qual a tarefa encontrar um leque de poss veis leituras independentes do contexto iv nfase na express o de regras estruturas e informa o dentro de um ambiente operacional procedimental computacional A cr tica de Wilks obsess o da lingu stica tradicional por uma Ci ncia da Linguagem ou uma teoria da linguagem natural se fundamenta no argumento segundo o qual n o se pode divisar os limites metaf sicos da linguagem natural O alento que o autor oferece para supera o desse impasse epistemol gico eminentemente pragm tico numa abordagem de lingu stica pr xima do crit rio de Popper para delimita o de uma rea ou de um ramo da ci ncia concentrar a aten o n o em seu objeto de estudo mas nos problemas que essa rea demarcada da ci ncia poder
173. delos apresentados anteriormente neste cap tulo comp em a ontologia 184 mais profunda com objetos que representam esse n cleo de conhecimento enquanto os objetos da ontologia mais superficial mostram as varia es de estrat gias e a diversifica o de produtos em torno desses conceitos centrais Os conceitos mais primitivos dos neg cios das organiza es competitivas elicit veis a partir dos modelos conceituais propostos nesta tese seriam aquilo que Roberts 1973 p 8 numa homenagem ao seu colaborador Max Fisch menciona como bens do intelecto Parsons escreveu Ben dell Intelletto no Inferno de Dante significa Bem Intelectual e Benjamin Peirce pai de CSP n s chamamos Ben dell Intelletto 6 2 Insights para intelig ncia competitiva O experimento mostra que pode se implementar a minera o de conceitos para a constru o de modelos de informa o em ambientes de Intelig ncia Competitiva de dois modos basicamente 1 com acesso direto aos conceitos minerados e 2 com acesso recursivo a novos textos e conceitos complementares Esses dois modos de acesso aos objetos de conhecimento ou bens de conhecimento na terminologia CommonKADS e suas implica es epistemol gicas s o discutidos a seguir 6 2 1 Modelo cognitivo com acesso direto informa o O uso de modelos mentais para acesso informa o e desenvolvimento do conhecimento abordado em v rias disciplinas cient ficas algumas mais
174. des de repert rio A elicita o do conhecimento compreende um conjunto de t cnicas e m todos que tentam elicitar o conhecimento de um especialista em algum dom nio por meio de alguma forma de intera o direta com o especialista importante ter em mente que n o se deve tentar obter reais descri es formais com uso de uma t cnica de elicita o Impor se representa es formais na elicita o tipicamente conduz a forte vi s no processo de elicita o e frequentemente resulta em dados ruins Elicita o deve ser focada e estruturada mas tamb m t o aberta quanto poss vel E a tarefa de modelagem do conhecimento para converter o material elicitado em uma descri o mais formal do processo de solu o do problema As pessoas que conduzem a elicita o e an lise do conhecimento os engenheiros do conhecimento tamb m chamados analistas do conhecimento tipicamente n o s o pessoas com um profundo conhecimento do dom nio da aplica o No caso mais simples o engenheiro do conhecimento pode ser habilitado para extrair informa o de uma variedade de recursos n o humanos livros texto manuais t cnicos estudos de caso e assim por diante As t cnicas que pela sua natureza apresentam recursos que poder o ser teis para apoiar os engenheiros do conhecimento na tarefa de classifica o de objetos sintagm ticos como objetos do neg cio em conceitos e modelos conceituais no estilo CommonKADS adotado nesta te
175. desenvolvimento de Intelig ncia Competitiva Esta segunda parte do experimento se reporta portanto quest o da representa o do conhecimento um tema desenvolvido em v rias disciplinas correlatas Ci ncia da Informa o tais como a Gest o do Conhecimento Como mencionado no Cap tulo 4 os principais m todos e t cnicas adotados nesta tese para representa o do conhecimento ou de um ponto de vista filos fico basilar para representa o da informa o sobre informa o s o a An lise de Conceito Formal e a Linguagem de Modelagem Unificada utilizando se eventualmente Gr ficos Conceituais como recurso de modelagem recursiva Com efeito a An lise de Conceito Formal um m todo de classifica o de objetos com base na incid ncia de atributos em um predeterminado contexto que depende da necessidade e da abordagem do usu rio E para sua consecu o o primeiro passo consiste na elabora o de uma lista de objetos e seu conjunto de atributos gerais parcialmente compartilhados obtida do experimento a Stop words palavras que comp em a estrutura sint tica mas sem import ncia sem ntica para a compreens o da ess ncia do tema tratado no texto em ingl s the of ae outras 123 Esses sintagmas objetos comp em essencialmente a mensagem da organiza o para o resto do mundo atrav s da Web revelando se como os cromossomos de seu DNA corporativo FULD 2007 componentes de informa o que a dist
176. dexadores e palavras chave para recupera o da informa o textual desenvolvida por Capuano 2009 baseada nas id ias de Gottschalg Duque 2005 adotou se uma estrutura padr o textual de busca nos textos digitais selecionados composta por sintagmas plurinominais Esses sintagmas complexos s o formados pela composi o de mais de um substantivo ou nome que se encontram pr ximos numa senten a sem intercala o de verbos indicando uma express o com maior teor sem ntico que um substantivo nome isolado A busca seletiva por sintagmas com esse padr o de composi o l xica se justifica na medida em que o objetivo da minera o textual no contexto epistemol gico desta tese primeiro conhecer se os conte dos informacionais dispon veis sobre as organiza es e seus neg cios ou seja conhecer se sobre o que est o falando E em segundo plano como est o falando sobre 6 O autor se refere como exemplo a uma pintura do artista Georges Seurat denominada The Seine at the Grande Jatte exposta no Royal Museum of Fine Arts de Bruxelas na B lgica As imagens digitais codificadas em formato de bitmaps mapas de bits tamb m s o exemplos correlatos 95 esses conte dos quest o que se insere numa segunda etapa de aplica o da metodologia quando se busca detalhes dos temas apresentados como essenciais nas fontes dispon veis Esta estrat gia de minera o de sintagmas complexos apresenta tr s vantagens t c
177. diretamente associadas aos processos de aprendizagem como educa o e neurosci ncia Ontoria De Luque e G mez 2006 p 22 23 por exemplo apresentam o tema definindo os mapas mentais como grandes teias de id ias e estabelecendo uma met fora correlacionando o aprendizado com mapas mentais e a pr pria estrutura do c rebro humano O funcionamento neuronal do c rebro com sua estrutura radial representa um bom referencial para explicar o significado do pensamento irradiante com sua estrutura radial Da mesma maneira que esta din mica neuronal consiste no estabelecimento de m ltiplas rela es ou associa es ramificadas quando se usa a express o pensamento irradiante faz se refer ncia queles processos associativos de pensamento que procedem de um ponto central ou se conectam a ele Buzan 1996 p 67 Quando uma unidade de informa o sentimento pensamento imagem externa situa o chega ao c rebro s o geradas muitas conex es com outros dados dispon veis Essas rela es ou entroncamentos irradia es produzidos s o indicadores da emerg ncia do pensamento irradiante Esse n cleo de conex es pode ser equiparado a uma esfera central acesa que se irradia para diferentes dire es O c rebro humano constitui assim um sistema superestruturado de processamento e armazenamento da informa o de tal forma que considerado uma gigantesca m quina de associa es ramificadas representada p
178. do se em dois princ pios A introdu o de m ltiplos modelos como meio de se lidar com a complexidade de processos de engenharia do conhecimento Il O uso de descri es no assim chamado nivel de conhecimento dessa metodologia como um modelo intermedi rio entre os dados de especialistas e o projeto do sistema Contudo o aspecto mais importante da obra desses autores no contexto da tese que se defende neste trabalho de pesquisa o reconhecimento de que os modernos sistemas de informa o transacionais corporativos est o se tornando t o complexos quanto os KBSs pensados no passado o que sugere tamb m uma oportunidade de utiliza o das mesmas t cnicas de modelagem Schreiber Wielinga e Breuker 1993 declaram a prop sito 3 Hessen 1976 considera que o fundador da doutrina filos fica do pragmatismo William James e n o Charles Sanders Peirce E que outro not rio representante do pragmatismo seria Schiller fil sofo ingl s que chamou essa doutrina de humanismo 45 Engenharia do conhecimento KE e engenharia de software convencional CSE s o campos intimamente relacionados Apesar de ambos campos enfatizarem diferentes aspectos do processo de desenvolvimento de sistemas n o h uma precisa fronteira entre sistemas de software convencional e sistemas baseados no conhecimento com a crescente complexidade de sistemas convencionais a fronteira na maioria das vezes muito t nue E tamb m a
179. dora baseada em sintagmas nominais inspirada nas id ias de Gottschalg Duque 2005 apresentando expressivo poder de resolu o sem ntica no pr prio processo de busca com pouca necessidade de busca recursiva para desambigua o de conceitos com efeito prev se que apenas conceitos relativos a inova es no contexto de neg cio exigem desambigua o e os modelos de avalia o da relev ncia da informa o baseados na Teoria da Informa o de Shannon e nas teses de Bateson Weick e Choo s o v lidos com ideias convergindo para a equa o do conhecimento de Brooks 1980 podendo ser utilizados para o desencadeamento de processos de cria o de significado acerca dos conceitos minerados e de constru o do conhecimento em contextos de neg cio e a metodologia tem recursos para simula o de cen rios permitindo avaliar se o impacto de novos conceitos na base de informa o conceitual e O processo de implementa o da metodologia de minera o e modelagem da informa o conceitual proposto se encontra em est gio intermedi rio de automa o computacional com uso de softwares dotados de recursos de Intelig ncia Artificial em algumas atividades cr ticas tais como etiquetagem e an lise sint tica demonstrando a utilidade 3 Deve se lembrar que os engenheiros do conhecimento atuando em reas de Intelig ncia Competitiva nas organiza es complexas dever o conhecer os principais conceitos referentes ao contexto do neg
180. dos num macro conceito denominado Estruturas Corporativas na Tabela 6 1 t m se alliance between technologists knowledge management experts and business professionals business activity monitoring bulk of Microsoft researchers chairman of Microsoft consultants from IBM eResearch Infrastructure Council Fujitsu Group management issues in partnership product team with goals e outros Tabela 6 1 An lise de Conceito Formal com as Cinco For as de Porter Objetos Conceituais Atributos Competitivos Forcas de Porter Macro E Clientes conceito q o dici se E Substitutos Entrantes Consumi Parceiros Formal Modelo CommonKADS Modificado Atuais Pie Organizac o e E Organiza o Tarefa e Organizac o Agente e e E Organiza o Insumo amp Produto e 8 Organiza o Tarefa Agente e e S Organiza o Tarefa Insumo amp Produto 5 Organiza o Agente Insumo amp Produto e e KA Organiza o Tarefa Agente A Insumo amp Produto Tarefa e Agente e 3 Insumo e Produto e E Tarefa Agente e e E Tarefa Insumo amp Produto e Agente Insumo amp Produto e e Tarefa Agente Insumo amp Produto e e Organizac o Ambiente Externo e e e Ambiente Externo Agente e e e E Ambiente Externo Tarefa Agente e e e Ambiente Externo Agente 2 Insumo amp Produto j i 9 Ambiente Externo Tarefa Agente Insumo amp Produto i d Ambiente E
181. e atuaria de modo autom tico respondendo a entradas inputs do ambiente com base em sensores sem comando dos usu rios Os softwares de seguran a e de monitoramento de desempenho de dispositivos de redes de computadores operam geralmente com base nesse conceito 1 Em geral cada plataforma computacional propriet ria de fabricante espec fico geralmente com caracter sticas fora dos padr es normativos da ind stria exige que os agentes de software de 168 conceitos n o causam tanto impacto no sistema cognitivo do analista como os da Figura 6 12 apresentando portanto menores valores relativos de auto informa o Os conceitos correlatos a Tracking Systems e Healthcare Systems da Figura 6 12 por envolverem conceitos algo estranhos para o mundo da TIC conceitos da rea de sa de ter o valor relativo maior de auto informa o que os conceitos correlatos a Application Analysis e Agents da Figura 6 13 que se referem a temas tradicionais da TIC Outro objeto sintagm tico interessante no conceito analisado processos de neg cio shopping assistant technology objeto n 828 do APENSO III B Embora sua composi o lexical apresente por si uma id ia do que se trata uma busca no Google com os argumentos de pesquisa IBM Research and shopping assistant technology resultam em apenas tr s endere os de conte dos publicados pelas organiza es de pesquisa da holding IBM Corp
182. e constru o de um modelo operacional que represente e interprete entradas de sinais sensoriais neurais tendo dois componentes uma parte sensorial formada por um mosaico de percep es de coisas mais at micas as quais ele cnama de percepts cada uma das quais encontrando algum aspecto das entradas e uma parte mais abstrata chamada gr fico conceitual que descreve como os percepts se organizam em conjunto para formar o mosaico A percep o seria ent o baseada nos seguintes mecanismos SOWA 1984 p 69 A estimula o gravada por uma fra o de segundo na forma de um cone sensorial O comparador associativo procura na mem ria de longo prazo por percepts que representem todo ou parte de um cone O montador disp e os percepts em conjunto num modelo operacional que forma uma montagem aproxima o da entrada E um registro dessa montagem armazenado como um gr fico conceitual Mecanismos conceituais processam conceitos concretos que t m associados tanto percepts como conceitos abstratos que n o t m percepts associados O processo estruturante da percep o humana de um objeto para Sowa se iniciaria com o uso de um dos rg os sensoriais como a vis o por exemplo que excitaria cones sensoriais e os associaria no comparador associativo a part culas de percep o os percepts estocadas em seu c rebro resultado de suas experi ncias sensoriais anteriores os pares cone percept que se revela
183. e de um verbo passivo com uso da part cula apassivadora por ou by no idioma ingl s Outros elos sint ticos entre objetos aparecem com certa frequ ncia nas elipses de transi o dos GCs como estado STAT STATE que seria a condi o mental emocional ou f sica em que se encontra uma pessoa ou coisa que tamb m pode ser interpretada como um atributo e recipiente do ingl s recipient RCPT RECIPIENT significando uma pessoa ou coisa que recebe algo O uso dessas rela es nos GCs um tanto intuitivo e derivado das pr prias regras do l xico especialmente quanto reg ncia e transitividade verbal n o apresentando dificuldade para os conhecedores das regras sint ticas do idioma natural de onde se extraem os conceitos Zeman 1997 p 15 argumenta que considerando se a semi tica de Peirce pode se tamb m afirmar que os GCs desempenham a fun o de representa o simb lica da informa o e n o uma representa o iconogr fica ou de indexa o Ou seja nos GCs o s mbolo conectado ao seu objeto em virtude da id ia de mente que utiliza s mbolos sem o que tal conex o n o existiria Os s mbolos primordiais processados pela mente humana no caso se referem aos da linguagem natural no construto basilar pensamento linguagem eis portanto a for a representacional dos GCs com base na filosofia 54 Outro exemplo o da Figura 3 5 de Cao e Creasy 1997 p 418 que ilustra a cap
184. e o trabalho com uma an lise de desempenho da metodologia experimentada face aos objetivos da tese 4 3 Procedimentos gerais Os procedimentos de simula o detalham as fases de modelagem programa o e experimenta o categorizadas por Pidd 1988 Os procedimentos gerais executados em cada fase s o apresentados a seguir A fase de modelagem da simula o exigiu pesquisa na literatura em busca de estudos de caso em que se utilizaram t cnicas promissoras no contexto al m do reestudo de alguns experimentos com metodologias e tecnologias conhecidas pelo pesquisador O uso de estrat gias e metodologias mistas e at do uso de dicion rios eletr nicos de sin nimos e tesauros ontol gicos foram avaliados nessa fase mas descartados da fase laboratorial do desenvolvimento da pesquisa pela sua inadequa o assumiu se que n o se exigiria o concurso de estruturas ontol gicas a priori da minera o de texto Como ressaltado anteriormente na fase de laborat rio selecionou se alguns softwares para implementa o do modelo de experimenta o Esse processo seletivo teve como crit rios b sicos sua adequa o aos requisitos do projeto experimental e os custos de instala o e opera o envolvidos com base no conhecimento acumulado pelo pesquisador Na fase de experimenta o foram executadas as opera es computacionais de apoio aos mecanismos de testes da metodologia elaborada nessa fase que foram testados os limites da capacid
185. e objetos componentes com ponta triangular oca apontando para a classe de objetos que contem esses componentes e de objeto atributo seta simples partindo da classe objeto para as classes Ontologia na Filosofia o estudo da natureza das coisas e dos seres e suas interrela es no mundo na Ci ncia da Informa o consiste de uma estrutura de conceitos ou entidades em um dom nio organizada com base em suas interrela es Sowa 1984 p 294 de um ponto de vista da an lise de conceitos conceitua ontologia para um mundo poss vel como um cat logo de tudo que constitui esse mundo como esse todo se apresenta em conjunto e como ele funciona Unified Modelling Language no original 8 C digos de etiquetas com base nas etiquetas utilizadas no software etiquetador TreeTagger DT artigo determinante NN substantivos comuns no singular VB verbo no tempo presente IN preposi o Etiquetagem de Parte do Texto de atributos Com o padr o sint tico representado pela sequ ncia substantivo preposi o determinante substantivo NN IN DT NN tem se uma rela o instanciada como motor do autom vel indicando que a classe autom vel possui um atributo denominado motor e com a sequ ncia padr o substantivo verbo determinante substantivo NN VB DT NN tem se uma rela o entre a classe mec nico e a classe motor onde com uma opera o de transforma o do verbo consertar no substantivo
186. e practical development of CELM Using CELM s analytical capabilities Finnair was able to establish profiles of its high value customers and focus its marketing strategy on passengers fitting those profiles As a result the airline reduced market costs by more than 20 percent and improved response rates by up to 10 percent In another engagement IBM Research IBM Global Business Services and IBM Retail Store Solutions teamed with Cuesol an IBM Business Partner to help turn customer information into useful profitable action for a large retail grocery chain The company sought a solution that would promote customer loyalty by enabling them to better manage their time in the store The grocer also wanted to hone its marketing efforts to reach shoppers with relevant targeted promotions as they traversed the aisles The solution was the IBM Personal Shopping Assistant which consists of a data management system wi fi network infrared technology and Bluetooth transmissions centered around touch screen computers mounted on shopping cart handles Customers scan in their loyalty cards to activate a familiar Web style screen with a variety of display options such as sale items or a list of products shoppers buy most frequently The Personal Shopping Assistant creates a map of the store and displays a suggested route A location tracking system monitored through ceiling mounted beacons enables the retailer to pinpoint shoppers locations and deliver releva
187. e processamento de dados desenvolvidas em linguagens de programa o de computador primitivas como Assembler devido tamb m a essa estabilidade e confiabilidade resultantes de anos de prova em ambiente de produc o As pr prias metodologias de desenvolvimento de SICs utilizadas nesse per odo se adequavam aos requisitos de sistemas est veis num mundo onde as mudan as nos ambientes de neg cios eram presumidamente lentas e pouco sens veis Entretanto com o avan o da globaliza o dos mercados os ventos das mudan as come aram a soprar cada vez mais fortes e com maior frequ ncia contestando o requisito da estabilidade nos modelos de sistemas organizacionais De certo modo a regra da estabilidade dos requisitos sempre representou uma simplifica o da realidade para fins de modelagem um reducionismo epistemol gico que contemporaneamente tem se mostrado cada vez menos til por exemplo como metodologia de desenvolvimento de SICs especialmente entre organiza es inseridas em mercados muito competitivos Como exemplos dessa dificuldade alguns paradoxos observ veis nos processos de desenvolvimento de sistemas organizacionais contempor neos s o A necessidade de reconhecimento do c digo dos SICs legados para o planejamento das mudan as Como esses sistemas foram geralmente desenvolvidos e evolu ram ao longo de anos nas organiza es os desenvolvedores de software hist ricos n o est o todos mais presentes e a document
188. e s o desenvolvidos contemporaneamente em temas correlatos ao aprendizado e popula o de ontologias a partir de corpora idiom ticos de dom nio espec fico CIMIANO 2006 Conforme Priss 2005 a An lise de Conceito Formal ACF um m todo da an lise de dados representa o do conhecimento e gest o da informa o ainda amplamente desconhecido entre os cientistas da informa o nos EUA apesar de sua potencial utilidade em aplica es tecnol gicas O m todo foi criado por Wille 1982 no in cio dos anos 1980 e desenvolvido na d cada seguinte por um pequeno grupo de pesquisadores e estudantes na Alemanha talvez devido necessidade de certo conhecimento matem tico necess rio para sua utiliza o A primeira aplica o industrial em larga escala se deu no projeto de um sistema de explora o de conhecimento para a Engenharia Civil e nos ltimos 15 anos ocorreu um crescimento do interesse no m todo na comunidade de pesquisas internacional observando se aplica es em v rias disciplinas tais como Lingu stica Engenharia de Software Psicologia Intelig ncia Artificial e Recupera o da Informa o A utilidade da ACF na Lingu stica com apelo mais expl cito para a formaliza o de processos de recupera o da informa o textual baseada em an lise sint tica n o se restringe a textos em linguagem natural mas se aplica tamb m a c digos fonte de programas de computador A experi ncia de Lindig e Snelting 199
189. e um idioma na cria o de senten as de conte do 86 til ocorre dentro de limites ou restri es da sintaxe do idioma restri es que intuitivamente poder o ser ainda maiores num contexto Com esse elo de representa o gr fica da informa o tem se uma esp cie de interlingua entre os modelos mentais expressos nos documentos textuais em linguagem natural e os modelos de sistemas de neg cio produzidos com a metodologia As vantagens dessa s ntese metodol gica se encontram no uso da linguagem natural para modelagem gr fica da informa o sem perda do rigor cient fico proporcionado pela l gica de primeira ordem e pela teoria matem tica de conjuntos e no tratamento sem ntico da informa o por meio das teorias de conceitos formais e de modelagem ontol gica O pr prio m todo de minera o de conceito proposto contribui para uma redu o dram tica sen o a elimina o de problemas sem nticos da informa o recuperada O contexto das organiza es competitivas apresenta certos padr es de documentos em linguagem natural que propicia o reconhecimento de estruturas can nicas que s o teis para a modelagem e padroniza o de sistemas organizacionais para miss es de an lise de intelig ncia e at de sistemas de informa o corporativos Outros recursos de representa o de conceitos proporcionados pelos Gr ficos Conceituais de utilidade para o tratamento sem ntico da informa o s o a abstra o e
190. ecessidades de readapta o cont nua ao ambiente global de neg cios em constante e cada vez mais acelerada muta o de modo a contribuir para a Intelig ncia Competitiva Esta abordagem se deve ao duplo imperativo que se apresenta s organiza es competitivas a de prever as mudan as no mercado e a de se preparar para as mudan as necess rias na pr pria organiza o para readapta o ao meio mutante Geralmente a disciplina de Intelig ncia Competitiva se ocupa apenas do monitoramento do mercado sem envolvimento com as quest es de gest o interna nas organiza es como se bastasse prever os movimentos da concorr ncia e acertar a b ssola corporativa para os novos rumos A rea de concentra o da pesquisa se justifica tamb m pela not ria depend ncia das organiza es contempor neas em rela o aos seus sistemas de um modo geral especialmente os sistemas de informa o de neg cios Os reflexos dessa depend ncia s o observados no cotidiano na quest o evolutiva dos sistemas informacionais baseados em computador onde enormes dificuldades se apresentam em projetos de mudan as em escala corporativa NEVO e WADE 2007 LUNA REYES et al 2005 STONE 1997 Embora tenham contribu do historicamente para a evolu o sociot cnica das organiza es e do mercado ap s a 2 Guerra Mundial com ganhos de produtividade os sistemas organizacionais que moldaram o ambiente corporativo da segunda metade do S culo XX de
191. ecessidades espec ficas O que est impl cito nesse conceito de identidade algo como um DNA do cliente um padr o comportamental de consumo que o identifique entre outros clientes obviamente muitos clientes poder o ser agrupados por similaridade de padr es sem preju zo do conceito Como vimos ao longo dos modelos apresentados nesse contexto a organiza o IBM Research apresenta em seu website uma mensagem para o mundo bastante competitiva anunciando projetos de desenvolvimento de produtos tecnol gicos tanto para desbravar mercados emergentes como entrante no modelo de intelig ncia baseado nas for as de Porter como para se consolidar em mercados atuais na condi o de player atual Como entrante a organiza o promete produtos inovadores para os mercados de servi os de sa de de propriet rios de autom veis e redes lojistas de varejo e como player atual mostra como pretende satisfazer 173 atuais clientes com seus aplicativos de monitoramento e diagn stico de problemas de desempenho em sistemas computacionais 6 1 2 4 Modelos de informa o do contexto Microsoft Research Os 23 objetos sintagm ticos do contexto Microsoft Research agrupados no conceito de processos de neg cio representando 2 5 dos substantivos mais frequentes s o CAD tools development of systems communications systems computer graphics achievement computer hacking computer interaction computer recognition computer sc
192. ecimento 194 7 CONCLUS ES E QUEST ES EM ABERTO 7 1 Tese e resultados do experimento Com base nos resultados do experimento desenvolvido evidencia se uma vi vel metodologia de minera o e an lise de informa o conceitual relevante de fontes digitais para modelagem semi autom tica de sistemas de neg cio em ambientes de Intelig ncia Competitiva alcan ando se o principal objetivo desta tese A metodologia demonstra como o arsenal epistemol gico da Intelig ncia Artificial IA implementado em softwares de etiquetagem e de an lise sint tica pode contribuir efetivamente para o desenvolvimento de mosaicos conceituais representando informa es essenciais para indu o de processos de cria o de significados e constru o de conhecimento sobre os ambientes de neg cios Assim resta evidente que esse tipo de ambiente informacional poder ser estruturado pelo menos em parte a priori com potencial para atendimento tanto de demandas ad hoc como para uma atividade de intelig ncia mais proativa no sentido de se antecipar s necessidades dos usu rios construindo se um mosaico de informa o abrangente sobre o mercado incluindo os principais competidores potenciais entrantes e substitutos parceiros e clientes conforme a abordagem epistemol gica de Porter Os resultados da experi ncia de laborat rio tamb m permitem um refinamento da tese original que ent o passa a ser vi vel a estrutura o de uma praxis de
193. ecimento Considerando se que conhecimento pode ser resumidamente definido de modo pr tico como informa o sobre informa o SCHREIBER et alli 2000 esses portais podem ser considerados uma evolu o natural dos primitivos portais dessa classe E no contexto desta tese importante destacar se as caracter sticas chave desses portais referentes s duas categorias cr ticas de Davydov 2001 p 132 133 106 1 Identifica o e categoriza o de recursos de informa o corporativa e produ o e entrega de conte do relevante 2 Processamento de informa o orientada ao conhecimento Quanto aos portais de colabora o eles destinam se n o somente a conectar pessoas a fontes de informa o mas tamb m e talvez principalmente pessoas a pessoas em contextos de 6 Eles se destinam realiza o de tarefas por isso s o classificados como portais de trabalho solu o de problemas em equipe sendo portanto focados na disponibiliza o de ambientes virtuais onde grupos de pessoas podem interagir trocando informa o ou desenvolvendo tarefas em conjunto com uso de aplicativos de software em rede Exemplos desse tipo de ambiente abundam podendo se citar na academia o MOODLE Modular Object Oriented Dynamic Learning Environment e no mercado os ambientes de gerenciamento de projetos o AutoCAD para projetos de engenharia e o Microsoft Project para projetos em geral e seus similares com c digo ab
194. elas estruturas neuronais do c rebro que potencializam o pensamento A grande capacidade de processamento da informa o e de aprendizagem possibilita o pensamento irradiante por viabilizar o estabelecimento de m ltiplas conex es com a informa o dispon vel 185 O que se busca portanto a cria o de estruturas que formem uma totalidade unificada o que coincide com o processo do c rebro cuja tend ncia a da globalidade ou de formas hol sticas de pensamento A simples utiliza o da palavra e da imagem como fontes de est mulos e de conhecimento uma forma de multiplicar o potencial do c rebro O tema tamb m objeto de pesquisa na Intelig ncia Artificial desde a origem desta disciplina nos anos 1950 como apresentado por Capuano 2009 com o mesmo enfoque das conex es neuronais no processo cerebral de aprendizado A abordagem do processo de pensamento irradiante de Ontoria De Luque e G mez converge com as id ias de Brooks 1980 p 131 sobre as rela es entre informa o e conhecimento Qual a rela o entre informa o e conhecimento Eu percebo conhecimento como uma estrutura de conceitos conectados por suas rela es e informa o como uma pequena parte dessa estrutura A estrutura do conhecimento pode ser subjetiva ou objetiva Eu expressei esse relacionamento por aquela que eu denominei a equa o fundamental K S Al K S AS que estabelece de um modo geral
195. em Sintagmas Plurinominais Os dados apresentados na planilha do APENSO Il resultaram de contagens de nomes substantivos mais frequentes em sintagmas plurinominais diferindo da abordagem experimental que resultou os dados do APENSO apenas por este detalhe Os quatro primeiros blocos de dados dessa 119 planilha se referem s quantidades de substantivos consideradas nesta an lise que se referem aos 2 5 5 0 7 5 e 10 0 mais frequentes os dados do ltimo bloco intitulado 100 096 se referem aos mesmos do APENSO com todos os substantivos utilizados pelas organiza es em cada colet nea de Web Portal Repetidas n o 0 i gt S A o o E o o c o o i o A 20 000 40 000 60 000 80 000 100 000 N mero de Palavras Gr fico 5 2 Raz o entre Substantivos e Palavras na Amostra de Textos Analisando se os dados do primeiro bloco esquerda no APENSO Il ap s as colunas de numera o e t tulos dos textos com os 2 5 de substantivos mais freq entes observam se na primeira coluna esquerda as quantidades absolutas de substantivos QAbs nessa frequ ncia na segunda coluna as quantidades desses substantivos mais freq entes que tamb m comp em sintagmas plurinominais Quantidade em Sintagmas ou QeS e na terceira coluna a rela o percentual entre os substantivos que comp em sintagmas e o total de substantivos nessa freq ncia As colunas dos blocos seguintes seguem ess
196. enheiros eles t m realizado um bocado de grandes trabalhos Assim se voc combina o trabalho deles e o nosso trabalho a velocidade na qual voc pode inovar e ter as coisas executadas dramaticamente mais r pida Ent o na verdade sobre as pessoas que est o l e que querem se unir e criar um sistema de busca melhor um portal melhor para um conjunto muito amplo de clientes Esta a vis o que se encontra por tr s quando dizemos hey esta n o seria uma grande combina o CNET 2008 12 para solu o de seus problemas de pesquisa Esta uma das raz es pelas quais n s temos falhado em consolidar nos como um campo em torno de um paradigma metodol gico padr o Outro aspecto dessa motiva o para a pesquisa num plano pessoal do pesquisador se refere ao interesse e utilidade de outra rea multidisciplinar envolvida no contexto a Intelig ncia Artificial Os conceitos de informa o conhecimento e intelig ncia est o cada vez mais interconectados na era da informa o digital e a tese que se apresenta elabora de um ponto de vista pragm tico uma s ntese epistemol gica envolvendo esses tr s aspectos sociot cnicos do comportamento humano individual e coletivo nas organiza es A Intelig ncia Artificial pela sua complexidade ao pretender emular a intelig ncia humana n o tem limites naturais de atua o em termos de objeto de pesquisa outro atrativo para quem aprecia temas multidisciplinares e transdisciplin
197. enta o do conhecimento Os problemas que sistemas conceituais apresentam para a an lise de textos em sublinguagem cient fica s o claros Em primeiro lugar sistemas conceituais perdem inteiramente o rastro do l xico porque eles s o sistemas decomposicionais e portanto baseiam se em estruturas primitivas elaboradas n o no l xico em si Isso elimina efetivamente a especificidade requerida para uma sublinguagem cient fica Segundo o conjunto de conex es entre as primitivas n o suficientemente grande para capturar toda a informa o sem ntica subjacente no texto ou mesmo uma parte interessante dela Isto significa que um conjunto de rela es sensitivas de superf cie necess rio e por isso o abstracionismo dos sistemas conceituais aparenta ser uma defici ncia no caso da sublinguagem cient fica Embora o argumento de Frawley 1988 se reporte a sublinguagens de disciplinas cient ficas a compara o com os textos e contextos do experimento desta tese v lida para compreens o dos problemas estruturais da minera o conceitual baseada na linguagem natural para os quais se prop e solu o Outros excertos de Frawley 1988 p 344 345 revelam que mesmo numa era pr Internet tinha se uma vis o integrada da minera o de textos com a necessidade de abordagens mistas como a l xico conceitual para gest o do conhecimento Quando se olha para o que a an lise de textos em sublinguagem cient fica na pr t
198. entar o macro problema objeto da pesquisa proposta de modo silog stico considerando se P1 que as organiza es contempor neas operam seus processos de neg cio com suporte de processos e sistemas de informa o computacionais SICs baseados em tecnologia de informa o e comunica o TIC e que P2 mudan as cada vez mais frequentes e s vezes traum ticas nos ecossistemas de neg cios onde elas se inserem as obrigam a mudan as constantes desses processos para se readaptarem ao meio mutante pode se concluir que C essas mudan as necess rias de processos de neg cios requerem para se tornarem operacionais mudan as nos processos decis rios e operacionais e nos SICs legados ou o desenvolvimento acelerado de novos SICs cada vez mais complexos para suportar novos processos de neg cio O cen rio de mudan as de processos para readapta o das organiza es aos seus ecossistemas de neg cios discutido conceitualmente por Hammer e Champy 2001 no conceito de reengenharia Como as organiza es s o dependentes de seus sistemas organizacionais para operar o neg cio e das TIC que os suportam as conex es entre muta es ambientais processos sistemas de informa o e tecnologias s o evidentes problema comum em grandes organiza es privadas e p blicas em praticamente todo o mundo inclusive em pa ses em desenvolvimento como frica do Sul Brasil Chile Cor ia Sri Lanka e outros CAPUANO 2007 CZARNEWSKI 2007
199. ente e para verificar poss veis perturba es em rela o situa o anterior possa consultar apenas as frequ ncias relativas de substantivos nomes Caso observe alguma altera o nas posi es relativas de frequ ncias dever ent o aprofundar sua an lise e buscar na base indexada os respectivos novos sintagmas plurinominais que causaram essa altera o e providenciar os novos modelos atualizados de informa o conceitual conforme a metodologia apresentada nesta tese Como normatizar ent o as frequ ncias dos substantivos nomes acrescentados base Ou numa vis o t cnica de PLN como tornar os novos textos t o informativos quanto a base preexistente considerando se as tend ncias estat sticas de frequ ncias de tokens em textos de diferentes tamanhos Como discutido anteriormente textos maiores tendem a repetir mais palavras e por isso apresentam palavras com frequ ncias maiores Ent o prop e se uma normatiza o baseada em par metros ling sticos mais est veis de textos de um ponto de vista sem ntico elegendo se a vari vel quantidade absoluta de substantivos nomes n o repetidos para tanto Considerando se que os conceitos elicitados dos textos residem nos substantivos nomes e nas combina es entre eles que s o no caso os sintagmas complexos conclui se que os objetos lexicais que interessam aos sensores conceituais temporais s o esses O modelo proposto de normatiza o de frequ ncias dos subst
200. entes Os sensores inteligentes mencionados na introdu o a esta tese podem ser implementados portanto mediante uso da metodologia de minera o e modelagem conceitual proposta integrando conceitos de superf cie com primitivas conceituais desenvolvidas com popula o e aprendizado de ontologias 6 1 2 5 Fujitsu Research vs IBM Research vs Microsoft Research A Figura 6 17 representa um modelo mental com os conceitos minerados no contexto competitivo das tr s organiza es Fujitsu Research IBM Research e Microsoft Research Os 181 conceitos centrais do discurso de cada organiza o apresentados na Web se encontram no c rculo interior tais como Delivery Service Analysis e Computer os conceitos derivados se encontram nas elipses dispostas na periferia do c rculo central em cada contexto organizacional como Value in Service Innovations Warning System for Automobiles e Life support Systems Mercado de Tecnologia da Informa o e Comunica o i Contexto Fujitsu IBM e Microsoft x Figura 6 17 Modelo Mental Comparativo dos Conceitos de Neg cio Minerados Fonte do autor da tese Com esse modelo pretende se apoiar a an lise comparativa dos conceitos de neg cio utilizados pelas tr s organiza es em sua mensagem para o mundo numa abordagem mista indutiva e dedutiva com inspira o nas no es de ontologia superficial shallow ontolo
201. entes sist micos s o essencialmente os mesmos anteriormente mencionados por Greenwald e Judd 2005 Como se pode observar por exemplo nos contextos das tr s organiza es estudadas em detalhe Fujitsu Research IBM Research e Microsoft Research esses tr s componentes de um sistema corporativo cl ssico s o representados com informa es conceituais numa s rie de sintagmas plurinominais e componente financeiro account transfers acquisition costs banking institutions business value cost of producing customer value delivery costs discounting strategies economics overview expertise in development finance group funds grants increase sales revenues marketing costs Microsoft funds research portions of stock productions costs reduction in safety stock requirements research and development budgets research grants revenue optimization rise in inflation sale trends study of economics team of economists value pricing warranty costs e componente tecnol gico 3 D scene advances into software analysis of the Web graph anti piracy cryptography area of research automation of production schedule bar code readers business continuity business modeling visualization business process CAD tools cell phones cloud computing data center architectures fault tolerance hardware systems information retrieval information systems logistics engineering media player Microsoft Windows model solutions for management natural l
202. er a mensagem que uma organiza o est transmitindo para o mundo por meio dos componentes textuais constitutivos dessa mensagem Esses componentes caracter sticos do l xico que tornam poss vel o conhecimento de uma organiza o na Web constituem o seu DNA que pode ser filtrado com algoritmos inteligentes de busca denominados de m s por Fuld 2007 p 156 grifos nossos Voc precisa compreender a linguagem e as nuances culturais do conte do da Internet mas voc n o est equipado para racionalmente classificar a informa o cr tica O truque identificar somente a informa o correta da Web e enxergar claramente por meio das milhares de distra es por meio e ao redor dos muitos espelhos refletindo os muitos peda os de informa es alguns verdadeiros outros n o alguns relevantes outros pura distra o Ao fazer isso voc precisa criar filtros de intelig ncia Esses filtros inteligentes come am com o conceito que denomino m s Um ima uma s rie de palavras ou frases que voc coloca junto em uma busca cada um representando um objetivo inteligente Os bibliotec rios denominam a conex o de palavras booleana como operadores e incluem palavras como e ou e nao O mundo on line tradicional e as ferramentas de busca da Web como Google empregam estes ou outros termos similares ou frases para excluir ou incluir conceitos de busca Os m s t m papel estrat g
203. er o processo de seu concorrente pode ensin lo a respeito do pensamento de gest o e a dire o estrat gica dele H mais na an lise de custo do que simplesmente colocar pe as juntas em um piso plano para representar como a sua empresa produz os produtos e servi os Seja um banco uma empresa de software ou uma fabricante de pepperoni conhecer como onde e o mais importante porque o concorrente gasta dinheiro em uma rea ou fun o em particular pode ensinar a voc muito a respeito de como ele pensa estrategicamente quais mercados deseja conquistar e como pretende chegar l Compreenda o processo e voc provavelmente entender como o seu concorrente se comporta hoje e no futuro Seus custos ditam o quanto de dinheiro voc disp e para investir em P amp D conduzir campanhas de marketing e publicidade e oferecer incentivos para sua rea de vendas e outras Quanto ao n vel estrat gico da an lise de contextos competitivos Fuld 2007 p 63 64 adota o modelo anal tico de estrat gia de Porter segundo o qual existem tr s estrat gias gen ricas que as empresas podem usar para serem mais lucrativas que a m dia das empresas no mesmo setor 1 elas podem diferenciar se e assim obter elevados lucros por meio de seus produtos 2 elas podem ter baixos custos ou 3 elas podem focar em um determinado segmento do mercado ou em um nicho geogr fico no qual haja menos press o dos concorrentes e das for as externas
204. ercado Ambiente Externo Insumo amp Produto que no contexto Fujitsu Research s o APENSO III A Asia strategy changes in society China India automobile market China s future climate change policy energy and environment policy market potential market risk e targets for Copenhagen Como se pode observar no sentido desses referentes esta superclasse se refere a temas 145 conceitos do ambiente externo organiza o e tamb m a insumos e produtos desse meio que poder o certamente impactar profundamente a estrat gia do neg cio da Fujitsu Research Em suma esse reticulado um modelo de representa o gr fica da informa o na minera o conceitual que permite classifica es com v rios cortes dimensionais associando se aspectos funcionais dos referentes objetos sintagm ticos com base no construto da Engenharia do Conhecimento com as For as de Porter O ltimo bloco de macro conceitos corresponde a conceitos mais completos contendo todos os atributos do modelo de an lise CommonKADS modificado mas composto por sintagmas raros nos textos tendo sido observados relativamente poucas vezes entre os sintagmas que cont m os 2 5 de substantivos mais frequentes estudados no experimento Exemplos alliance between technologists knowledge management experts and business professionals expansion of the Internet Web browsing technology Turing Award
205. erto um primitivo sistema de colabora o o pr prio ambiente de correio eletr nico onde os usu rios podem trocar uma s rie de mensagens interativas at se chegar a um consenso sobre determinado assunto A WWW atualmente oferece uma variedade de ambientes de colabora o sem custos diretos para os usu rios tais como o Google Docs Esses ambientes s o utilizados geralmente por comunidades de pr tica que constituem uma categoria de fonte de informa o para Gest o do Conhecimento nas organiza es E a ltima classe de Web portais apresentada na Figura 5 4 a de portal de neg cios e Business Portal representa o ltimo est gio na automa o das transa es de uma organiza o de mercado com seus clientes e parceiros externos nesse ambiente tecnol gico que uma organiza o no estado da arte do com rcio eletr nico realiza tanto as transa es de vendas de produtos como de aquisi o de insumos para seus processos produtivos em geral O conceito de Gest o da Cadeia de Suprimento Supply Chain Management ou SCM realizado nesse ambiente conectando pela Internet conte dos de informa o e servi os de todos os elos ou organiza es e pessoas da cadeia produtiva relacionada aos produtos da empresa propriet ria do Web portal Outro conceito o de organiza o em rede se aplica bem a essa categoria de portal que pode se desdobrar ainda em tr s subtipos Portal de Empresa Estendida Por
206. es preexistentes em algum reposit rio digital poderia amenizar essa dificuldade de se ter as pessoas certas no momento certo para se iniciar um projeto Com o fator tempo sendo tamb m um recurso cada vez mais escasso em ambientes de mudan a cont nua para adapta o e readapta o das organiza es aos ambientes de mercados competitivos presume se que alguma modelagem geral das ontologias de sistemas organizacionais a priori dos projetos espec ficos poderia significar um atalho importante para se alcan ar novos patamares de desempenho tecnol gico com sistemas de informa o especialmente em projetos de reengenharia e Arquitetura Orientada a Servi os A vis o contempor nea do desenvolvimento de software deposita na orienta o a objetos OO todo seu embasamento epistemol gico significando que o principal bloco de constru o dos sistemas de software a classe de objetos Conforme Booch Rumbaugh e Jacobson 2005 como objeto entende se uma coisa real ou abstrata geralmente extra da do vocabul rio do dom nio do problema ou do dom nio da solu o e como classe uma descri o de um conjunto de objetos que s o suficientemente similares do ponto de vista do respons vel pela modelagem para compartilharem uma especifica o comum Outra defini o de classes e objetos que 57 classes s o abstra es e objetos s o manifesta es concretas dessas abstra es E todo objeto tem uma ident
207. es da aplica o da metodologia s o modelos ontol gicos pict ricos com classes objetos e rela es povoados com sintagmas complexos extra dos dos textos digitais com inspira o nas id ias de Gottschalg Duque 2005 Esses modelos apresentam os conceitos e rela es mais relevantes em contextos de neg cio com objetivo de estimular cognitivamente os engenheiros do conhecimento nos seus processos mentais de cria o de significados e constru o do conhecimento til para Intelig ncia Competitiva O experimento mostra estatisticamente que a metodologia apresenta um desempenho bastante satisfat rio com revoca o de no m nimo 90 de um conjunto dos substantivos mais relevantes presentes em reposit rios de textos digitais sobre as organiza es INTELIG NCIA COMPETITIVA MINERA O DE CONCEITOS MODELAGEM DE CONCEITOS ENGENHARIA DO CONHECIMENTO INTELIG NCIA ARTIFICIAL ABSTRACT CAPUANO Ethel Airton Minerac o e Modelagem de Conceitos como Praxis de Gest o do Conhecimento para Intelig ncia Competitiva Bras lia Universidade de Bras lia Tese de Doutorado em Ci ncia da Informa o With the asymptotic growth of the digital volume of textual information available about organizations and the business competition methods and techniques of Knowledge Engineering for modeling and retrieval of relevant information in open repositories become increasingly important for the development of business processes With this motivat
208. es epistemol gicas com Gest o da Informa o e do Conhecimento Ci ncia da Informa o v 38 n 2 p 19 34 maio ago 2009 CAPUANO Ethel Airton Redesenho de processos e estruturas nas organiza es da Administra o P blica In KNIGHT Peter Titcomb FERNANDES Ciro Campos Christo CUNHA Maria Alexandra Org e Desenvolvimento no Brasil e no Mundo subs dios e Programa e Brasil S o Caetano do Sul SP Yendis 2007 p 585 625 CAPURRO Rafael HJORLAND Birger O conceito de informa o Tradu o de Ana Maria Pereira Cardoso Maria da Gl ria Achtschin Ferreira e Marco Antonio de Azevedo Perspectivas em Ci ncia da Informa o v 12 n 1 p 148 207 jan abr 2007 CHAUKE NEHME Cl udio Foreword In DO PRADO H rcules Antonio FERNEDA Edilson Orgs Emerging technologies of text mining techniques and applications Hershey New York Information Science Reference 2008 p xi 204 CHEN Peter Pin Shan The entity relationship model toward a unified view of data ACM Transactions on Database Systems v 1 n 1 p 9 36 mar 1976 CHOMSKY Noam Three models for the description of language H E Transactions on Information Theory v 2 n 3 p 113 124 1956 CHOO Chun Wei Information seeking in organizations epistemic contexts and contests Information Research v 12 n 2 jan 2007 Dispon vel em lt http informationr net ir 12 2 paper298 html gt Acesso em 25 jan 2007 CHOO Chun
209. esejos n o ter amos necessidade alguma de estudar a natureza apud KNELLER 1980 p 12 Esse conceito primitivo de diferen a como uma perturba o cognitiva como discutido a seguir representa a base antropol gica e psicol gica da pr pria no o de informa o no sentido de not cia aquilo que acrescenta algo novo na equa o do conhecimento de Brooks 1980 3 5 1 Conceito sentido e referente O uso da linguagem natural para representa o das coisas do mundo para n s mesmos e para interpretar o discurso de outros seres humanos um antigo tema de interesse da filosofia O problema se reporta ao significado meaning das palavras senten as e discursos que tratado em disciplinas como ling stica e semi tica ou semiologia Os ltimos cem anos de produ o filos fica sobre o problema do significado s o reapresentados por Richard 2003 com artigos seminais de Davidson Frege Kripke Horwich Putnam Quine Soames Wilson e outros Em particular interessa ao desenvolvimento das id ias desta tese a obra de Frege 2003 sobre os tr s aspectos cognitivos b sicos de signific ncia das coisas que s o denominados conceito sentido Sinn no original em alem o e referente Bedeutung Frege 2003 inicia sua argumenta o questionando se o termo igualdade comumente utilizado tamb m em linguagem matem tica uma rela o ou n o E se em caso positivo uma rela o entre objetos ou e
210. esentado a seguir com grifos nossos 1 Innovation in services is comprised of service product innovation service delivery innovation and service environment innovation 2 The following important factors for innovation in physical distribution and commercial distribution were derived by Kimura 2008 Research Report No 309 1 that it is possible to adequately acquire the necessary information for business at the business locations from the information systems 2 a company wide prevalence of a strong customer oriented philosophy that begins with top management 3 the activity of small groups at the business locations 1 and 2 are factors for both service product innovation and service delivery innovation in physical distribution and commercial distribution 3 is a factor of service delivery innovation in physical distribution and of service product innovation and service delivery innovation in commercial distribution These factors were verified based on the results of a questionnaire survey 3 The results of this verification reject hypothesis 1 regarding service delivery innovation in physical distribution and service product innovation in commercial distribution but support the other hypotheses For companies to gain an edge in service innovation among other companies in the same industry it is necessary that they pay attention to the factors verified as significant Embora o texto na integra desse relat rio esteja na We
211. este tipo de estrutura mostra um detalhamento conceitual maior baseado nos sintagmas que os modelos est ticos somente com classes e objetos 6 2 3 Sensibilidade temporal do modelo conceitual 6 2 3 1 Defini o do problema temporal O modelo apresentado at este ponto tem como objetivo propiciar uma vis o est tica do mosaico sem ntico do contexto de neg cio analisado Entretanto o mundo e o mercado s o din micos e mudam a todo momento necessitando se atualizar com a maior frequ ncia poss vel 190 os dados coletados das fontes digitais dispon veis especialmente dos Web Portais que s o o meio pelo qual as organiza es atualizam diariamente sua mensagem para o mundo A metodologia proposta poder atender a esse requisito com as abordagens apresentadas a seguir com base nos dados experimentais do APENSO IV relativos aos substantivos nomes mais frequentes nas faixas de 2 5 5 0 7 5 e 10 0 encontrados na colet nea inicialmente testada e num texto adicional pesquisado na Web posteriormente ambos do contexto Microsoft Research O texto se refere a uma entrevista concedida pelo executivo chefe da Microsoft sobre o interesse dessa empresa na aquisi o do Web Portal de buscas Yahoo CNET 2008 Observa se na planilha do APENSO IV uma coluna de enumera o de substantivos nomes mais esquerda e dois blocos de dados o primeiro denominado Colet nea Inicial e o segundo Acr scimo Colet nea O
212. estruturas conceituais mais complexas implementando o primeiro e o segundo princ pios da IA baseada na natureza Os percepts como part culas elementares da percep o humana s o o ponto de partida necess rio para implementa o de composi es mais complexas de conceitos implementando o terceiro princ pio mencionado Sowa combinou para desenvolvimento dos GCs recursos das RSs de Quillian com os Gr ficos de Depend ncia de Tesniere Hays para formar uma representa o sem ntica para a linguagem natural QUILLIAN 1968 HAYS 1964 TESNIERE 1959 A nota o gr fica com caixas ou ret ngulos e c rculos ou elipses considerados elementos pict ricos primitivos adequados do ponto de vista pragm tico pretendido foi influenciado pelos templates pl sticos adotados no desenho de modelos computacionais de softwares E alguns termos como join ajuntamento e projection proje o foram adaptados da Teoria da Base de Dados Relacional de Codd motivo pelo qual os GCs podem ser considerados descritores de rela es extensionais de bases de dados LUKOSE et al 1997 Em suma os GEs de Peirce propiciaram os ingredientes anteriormente ausentes mas necess rios para uma vers o rica e flex vel de redes sem nticas que culminaram no desenvolvimento de uma nota o simples e elegante juntamente com regras de infer ncia baseadas em gr ficos ao inv s das regras de substitui o da nota o alg brica A Figura 3 4 ilustra essas propr
213. estudo da natureza essencial das coisas no contexto desta tese se reporta ao problema da sem ntica endere ado como solu o na composi o sintagm tica plurinominal das estruturas de textos recuperadas na minera o Outro aspecto importante desse esclarecimento das id ias de Arist teles o da anterioridade da subst ncia para o conhecimento Ou seja o fil sofo adota uma abordagem eminentemente emp rica em rela o ao conhecimento tendo como base a subst ncia denotada em sua ess ncia pela refer ncia ling stica Com isso a an lise conceitual dos carnudos substantivos de Lispector 1998 como ponto de partida nos parece uma decis o acertada em termos de estrat gia experimental nesta tese O modelo de categorias de Arist teles no entanto tamb m apresentou uma dificuldade considerada excessiva para os fins a que se destinaria complexidade do processo de classifica o dos objetos sintagm ticos E isso se deve paradoxalmente sua maior vantagem que a capacidade de suporte a quaisquer objetos ling sticos expressos pelo ser humano Como os objetos textuais ou subst ncias minerados nos Web Portais corporativos representam na maior parte g neros mais abstratos compostos por objetos mais simples e denotam conceitos complexos elaborados no contexto do neg cio a velocidade de classifica o desses objetos complexos se revelou excessiva tornando essa atividade morosa e tediosa Como exemplos a cl
214. expand the overall customer value Our approach is unique in the way it provides marketing rules that are optimized with respect to long term profits throughout the lifetime of a customer and across different channels that the retailer may use This capability was realized by an intricate blending of advanced predictive modeling technology and mathematical modeling using the so called Markov Decision Processes of the dynamics of retailer customer interaction The system was benchmarked against Saks existing CRM methodology for managing its direct mail and store channels and initial results suggest that using the IBM approach could help boost store revenues Customer equity and lifetime management IBM s customer equity and lifetime management CELM tool offers clients further insight into customers long term value and helps them devise strategies to manage support and nourish customer relationships CELM uses specialized algorithms and analytical techniques to capture and analyze customer dynamics in order to model and improve long term customer relationships in a way that can help boost the value risk ratio of the overall customer portfolio Companies may reallocate marketing budgets dynamically to help maximize their return on investment and increase customer lifetime value and loyalty When Finnair wanted to redesign and improve its customer loyalty management process it asked IBM for assistance and ended up being an important partner in th
215. exto e utiliz lo como vantagem competitiva no neg cio Os modelos mentais desenhados com base nessa metodologia s o representados preferencialmente de modo pict rico mas embasados em formalismos matem ticos e em linguagens de modelagem de sistemas de informa o comumente utilizadas no mercado buscando se com isso uma linguagem de modelagem mais gen rica mais pr xima da linguagem natural e menos dependente de idiomas artificiais Com isso uma das vantagens da metodologia 6 proposta o uso da linguagem natural pois esta a que mais aproxima as linguagens dos desenvolvedores de sistemas organizacionais da linguagem dos operadores do neg cio numa organiza o O processo de elabora o da arquitetura da informa o nesse framework formalizado com emprego de entidades l gico matem ticas de modelagem de conceitos desenvolvidas com a metodologia denominada An lise de Conceito Formal ACF e representadas com a Linguagem de Modelagem Unificada UML Com essa formaliza o l gico matem tica pretende se construir a base cient fica para as teses propostas a partir do referencial te rico dos resultados dos experimentos e dos insights decorrentes Os fundamentos filos ficos e cient ficos dessa abordagem conceitual s o encontrados em obras de pesquisadores europeus da d cada de 1980 WILLE 1982 tendo se iniciado sua dissemina o na Ci ncia da Informa o dos EUA h apenas alguns anos PRISS 2005 As figuras a
216. extra dos de verbos da linguagem natural prevendo intera es m quinas de estado e atividades Os agrupamentos s o a parte organizacional da UML onde o modelo pode ser decomposto em pacotes que s o mecanismos puramente conceituais de organiza o tanto de coisas como de comportamentos eles s o tamb m reflexivos empacotando os pr prios agrupamentos Os artefatos anotacionais representam a parte explanat ria em linguagem natural dos modelos com UML coment rios marca es e notas As rela es entre classes e objetos na UML conforme a representa o pictogr fica da Figura 3 6 s o de tr s tipos 1 depend ncia 2 associa o e 3 generaliza o e realiza o A depend ncia uma rela o sem ntica entre dois elementos de um modelo na qual a mudan a de um elemento o independente pode afetar a sem ntica do outro elemento o dependente uma associa o uma rela o estrutural entre classes que descreve um conjunto de liga es uma liga o sendo uma conex o entre objetos que s o inst ncias das classes uma generaliza o de fato uma rela o de especializa o e generaliza o dependendo do ponto de vista da an lise na qual o elemento especializado elemento filho incorpora a especifica o do elemento generalizado elemento pai e compartilha a estrutura e seu comportamento e uma realiza o uma rela o sem ntica entre classificadores onde um classificador especifica
217. ferir a e refletir o dom nio do mundo real e ser expressos com um vocabul rio compreens vel pelas pessoas envolvidas no projeto do sistema eis a raz o portanto pela qual os artefatos do m todo utilizam a linguagem natural outro atributo de interesse para o experimento em quest o Os desenvolvedores do CommonKADS tamb m revelam uma preocupa o t pica de abordagens de minera o de dados a descoberta de padr es Schreiber et al 2000 p 16 17 argumentam que grifos nossos 128 N o preciso dizer que conhecimento racioc nio e solu o de problemas constituem fen menos extremamente ricos O conhecimento pode ser complexo mas n o ca tico conhecimento parece ter ao contr rio uma est vel estrutura interna na qual podemos ver padr es de similaridade repetindo se diversas vezes Apesar de uma arquitetura de conhecimento ser claramente mais complicada que uma de sistemas baseados em regras o conhecimento tem uma estrutura compreens vel e isto constitui o gancho pr tico para se realizar an lises de sucesso Conceitualmente os modelos de conhecimento nos auxiliam na compreens o do universo da solu o de problemas humanos com a elabora o de tipagem de conhecimento E um importante resultado da moderna engenharia do conhecimento que o conhecimento humano pode ser analisado em termos de categorias padr es e estruturas de conhecimento est veis e gen ricas Epistemologicamente a abordage
218. ficiais de Frawley 1988 eles sempre estar o dispon veis para consulta no construto elaborado com base no m todo proposto nesta tese e ainda poder o ser filtrados com base na frequ ncia dos substantivos que eles representam nos textos Caso se queira descobrir apenas as estruturas lexicais essenciais pode se restringir a An lise de Conceito Formal apenas aos sintagmas representando os substantivos mais frequentes definindo se os par metros dessa amostra que no experimento calibrou se o sistema para operar com 2 5 5 0 7 5 e 10 0 155 Com isso conclui se que a metodologia proposta permite a superac o do dualismo dos sistemas de conceitos quanto nfase nas informa es primitivas ou nas informa es de superf cie ao mesmo tempo propiciando a representa o gr fica de conceitos superficiais extra dos diretamente dos textos e o aprendizado de ontologias mais profundas com primitivas a partir de insights indutivos e dedutivos Com essa explana o inicial pode se prosseguir na explora o conceitual dos demais contextos IBM Research e Microsoft Research A Figura 6 7 e a Figura 6 8 apresentam os respectivos diamantes conceituais dessas organiza es observando se visualmente as distribui es quantitativas de objetos entre os conceitos Modelo de Insumo Produto Modelo de Tarefa Figura 6 7 Reticulado de Conceitos do Contexto IBM Research Fonte do a
219. frequ ncias dos substantivos nomes preexistentes O cen rio portanto exige uma solu o que torne os substantivos nomes relativos s novidades t o destacados em termos de frequ ncia quanto os substantivos nomes da base anterior Os dados do APENSO IV mostram o problema do desencontro de magnitudes de frequ ncia entre colet neas de tamanhos muito diversos Enquanto a colet nea do contexto Microsoft Research soma 1 159 substantivos nomes distintos n o repetidos como se pode observar no APENSO o novo texto adicionado base soma apenas 289 substantivos nomes distintos E por isso as frequ ncias dos substantivos nomes mais carnudos tamb m s o muito d spares research o substantivo mais frequente na base preexistente aparece 278 vezes enquanto thing o substantivo mais frequente no texto novo aparece apenas 34 vezes E assim por diante 191 computer por exemplo aparece 80 vezes na base enquanto Yahoo aparece apenas 14 vezes no texto acrescentado colet nea base 6 2 3 2 Solu o proposta Como solu o prop e se uma abordagem de normatiza o das frequ ncias dos substantivos nomes mais frequentes encontrados nos textos acrescidos colet nea preexistente de modo a torn las relativamente destacadas na base como um todo a partir de uma atualiza o O que se prop e assim que o engenheiro do conhecimento possa atualizar a base de informa o textual preexist
220. g costs poor or inconsistent care quality and inadequate access for people in many countries At the same time advances in medical technology including genomics regenerative medicine and information based medicine show promise for helping develop new treatment strategies while advances in information technology are paving the way for improved healthcare delivery and tracking systems IBM s Healthcare and Life Sciences group has been instrumental in developing and integrating advanced computational hardware and software to provide the infrastructure that enables advances in medical and biological research and healthcare delivery At IBM s Watson Hesearch Center Joe Jasinski IBM Distinguished Engineer and Program Director for Healthcare and Life Sciences Hesearch is working to develop strategies and coordinate efforts across IBM s Research Division in areas ranging from the use of information technology in payer provider healthcare to computational studies in molecular biology We bring deep technical expertise and unique capabilities such as the Blue Gene supercomputer to bear on problems that most other organizations cannot meaningfully address says Joe In addition to his Research responsibilities Joe has contributed his expertise to IBM Research Services where he has coordinated with Global Business Services to bring his and other researchers skills directly to the clients Prior to his current position Joe served as worldwide o
221. ganiza o tarefa agente insumo amp produto Concorrentes ambiente externo agente Concorrentes ambiente externo tarefa agente Concorrentes ambiente externo agente insumo amp produto 2more Figura 6 1 Reticulado de Conceitos CommonKADS Modificado amp For as de Porter Fonte do autor da tese O pen ltimo bloco de macro conceitos For as de Mercado se refere a conceitos gerais mais citados pelas organiza es estudadas mas sem vincula o com organiza es clientes ou parceiros constituindo se geralmente conceitos corporativamente neutros mas conhecidos como de impacto geral na sociedade Esses conceitos s o assim classificados por n o conterem atributos de agente nos sintagmas apesar de se referirem ao ambiente externo organiza o tendo se como exemplos air and water quality body of regulations chip technology climate change enrollment of women ideas around the world Immunodeficiency Syndrome research efforts in nanotechnology sales revenues San Francisco science fairs silicon chip spare parts inventory e outros O reticulado da Figura 6 1 um recurso para orienta o preliminar do analista caso queira partir de uma concep o funcional dos objetos de minera o tal como a fun o Substitutos Entrantes Com essa fun o em mente o analista Engenheiro do Conhecimento poder talvez se interessar pelos referentes do macroconceito e sentido For as do M
222. gem de Modelagem Unificada e Gr ficos Conceituais para representa o da informa o de modo a propiciar a identifica o de significados nos pr prios conceitos ling sticos resultantes da minera o textual e nas rela es entre os mesmos Figura 5 2 O ser humano elabora conceitos mais complexos apoiados em conceitos mais simples e concretos no sentido f sico mais pr ximos da subst ncia primordial e seus atributos da classifica o ontol gica metaf sica de Arist teles Obviamente a pilha de conceitos sugerida na Figura 5 2 uma abstra o da realidade sugerindo que essa constru o de conceitos ocorre como uma pir mide na realidade o que se observam s o conceitos que se relacionam em rede ainda que exista uma hierarquia de significados onde conceitos mais complexos envolvem conceitos mais simples na sua composi o etimol gica e epistemol gica 97 Objeto de Conhecimento 3 abstratos Objeto de Conhecimento 1 Objeto de Conhecimento 2 concretos Figura 5 2 Pilha de Conceitos Fonte do autor da tese Com esse modelo ontol gico espera se que os objetos de conhecimento ou bens de conhecimento SCHREIBER et alli 2000 mais preciosos se encontrem nas conex es ou relacionamentos entre os conceitos Sowa 1984 p 76 argumenta a respeito que Conceitos abstratos adquirem significados n o mediante associa es diretas com percep es mas mediante uma vasta
223. gio at 2020 o autor prev o uso disseminado de ambientes virtuais com aplica es de mercado inteligente smart market De fato esse tipo de aplica o j existe na Web atual com objetivo de otimiza o das transa es num determinado momento entre N consumidores e M potenciais fornecedores de um determinado produto como ocorre por exemplo na distribui o de g s natural Esse tipo de aplica o busca satisfazer v rios crit rios de otimiza o tanto do ponto de vista do consumidor como do fornecedor com uso de l gica e sofisticados m todos matem ticos Com esse cen rio embora se reconhe a a possibilidade de obten o de informa o digital sobre organiza es em outros reposit rios tais como algumas bibliotecas digitais especializadas algumas de livre acesso considera se nesta tese a WWW como a principal fonte de informa o para Intelig ncia Competitiva E pode se nesse cen rio destacar tr s grandes agrupamentos de informa es mais relevantes para a fun o de compartilhamento da informa o no modelo da Web 2 0 tendo em vista uma pol tica de Gest o do Conhecimento para Intelig ncia Competitiva 5 ivre no sentido de acesso gratuito pela Internet 104 Informa o para a clientela consumidores Il Informa o para os parceiros internos colaboradores no quadro da organiza o e externos acionistas e outros colaboradores e organiza es parceiras Ill Informa o para
224. gnificados e desenvolver insights para Intelig ncia Competitiva A relev ncia dos conceitos minerados e modelados nesse mosaico ser discutida em cada caso com base na Teoria da Informa o de Shannon SAYOOD 2000 e nas teses psicol gicas de Bateson 2002 Weick 1995 e Choo 2003 apresentadas no Cap tulo 3 Outro aspecto que ser desenvolvido neste cap tulo se refere aos processos mentais de Engenharia do Conhecimento que podem ser utilizados para solu o dos problemas de Intelig ncia Competitiva nas organiza es que exigem racioc nio l gico em contextos informacionais Com a an lise de modelos de informa o espec ficos que tamb m podem ser chamados de modelos conceituais pretende se mostrar como esses modelos podem contribuir para o desenvolvimento de uma intelig ncia emergente um conceito de Intelig ncia Artificial baseado na natureza Esse conceito sugere no contexto em estudo que a partir de fragmentos de modelos de informa o conceitual relevante pode se construir modelos mais completos e complexos teis para o desenvolvimento de insights em Intelig ncia Competitiva Ou seja prop e se com esse construto mostrar como se pode obter com base na Teoria da Informa o de Shannon SAYOOD 2000 e nas teses de Bateson 2002 Weick 1995 e Choo 2003 diferen as que fazem diferen as e informa o sobre informa o til para Intelig ncia Competitiva Entretanto surge o seguinte desafio
225. gy e ontologia profunda deep ontology A prop sito Staab 2006 p 99 argumenta que Nem todas as ontologias t m as mesmas caracter sticas e em geral podemos distinguir ontologias profundas de ontologias superficiais Ontologias profundas s o frequentemente aquelas encontradas na ci ncia e na engenharia onde consider veis esfor os s o empregados na constru o e no desenvolvimento da conceptualiza o Em dom nios tais como prote mica e medicina a ontologia est num sentido muito real dos dados de interesse Isso se torna aparente quando usamos uma ontologia para classificar conjuntos complexos de propriedades como constituintes de certos tipos de objeto Ontologias superficiais cont m poucos termos relativamente imut veis que organizam volumes de dados muito grandes por exemplo termos como cliente n mero de conta e saque a descoberto utilizados em contextos banc rios e financeiros ou as rela es b sicas que definem informa es geoespaciais 182 O que se prop e para an lise dos modelos conceituais minerados no m todo em tela considerar se os conceitos obtidos na An lise de Conceito Formal como uma ontologia superficial mas buscando se interpret los para se chegar compreens o de uma ontologia profunda m nima referente ao contexto Essa ontologia superficial seria baseada no l xico em particular nos sintagmas nominais minerados e especialmente nos que representam os substantivos mais freq e
226. help analyze interactions between its call center help desk and customers Transcripts of each call were mined to look for patterns such as repetitive calls from the same person that indicated an issue was not being resolved Both companies are developing strategies to use the BIW tool on an ongoing basis to help them target inefficiencies and problems before they develop into major crises Meeting competitive challenges with CRM In today s speed of light information saturated business climate a company s success often depends on turning mountains of data into actionable knowledge that can be used to identify and profile its high value customers and their buying patterns IBM Research Services offers clients an assortment of powerful CRM tools designed to assist in analyzing data and generating the information and insight needed to focus business strategies and marketing efforts on retaining and expanding this core customer base while gaining a competitive edge in the global marketplace oportuno destacar se dos conceitos tratados nesse texto da IBM Research um conceito mais fundamental utilizado pelas organiza es mais competitivas nos mercados o da identidade comportamental de cada cliente individualmente Embora a sociedade ocidental contempor nea tenha se tornado uma sociedade de massas com consumo de massas o mercado est se voltando para as transa es onde o cliente tratado como se fosse nico buscando se atender a suas n
227. ia adotando se nossa l gica como nossa metaf sica SEARLE et al 1997 p 1 Embora Peirce 1909 depositasse no seu construto metodol gico de modelagem da informa o e conhecimento a capacidade de execu o de opera es com base em diagramas externas ou internas tomando o lugar de experimentos com coisas reais sua obra come ou a ser reconhecida somente na d cada de 1960 com Zeman 1964 e de 1970 com Roberts 1973 Searle et al 1997 p 2 argumentam que os GEs de Peirce representam o primeiro modelo articulado de processamento da informa o e conhecimento implementando a id ia de representa o do curso geral do pensamento com exatid o vis a vis o c lculo de predicados de primeira ordem o que para Peirce seria a l gica do futuro importante ressaltar se o conceito de experimentalismo de Peirce que primordialmente racionalista elegendo a l gica como uma forma prim ria de experimenta o sobre a estrutura da realidade Conforme comentam Lukose et al 1997 p 3 Peirce entendeu tanto como qualquer dos seus ancestrais filos ficos que nunca f cil ser um metaf sico realista particularmente se o mesmo abranger como Peirce o 51 fez a necessidade de experimentac o e as modalidades do poss vel do prov vel e suas chances de serem constituintes da realidade Outro importante aspecto da obra seminal de Peirce no contexto seu pragmatismo Lukose et al 1997 p 4 p
228. ica tem apresentado como exemplos Grishman e Kittredge 1986 Kittredge e Lehrberger 1982 parece que a an lise de textos cient ficos de sucesso deve proceder a partir de uma base l xica Existem duas raz es para isso 1 um modelo l xico de sublinguagem cient fica focado em conte do 2 um modelo l xico colocacional de superf cie Existe toda uma gama de argumentos defendendo que o conte do supera a forma em textos de sublinguagens cient ficas e consequentemente que o conte do grosseiramente compar vel com o l xico a forma ret rica em textos cient ficos de menor import ncia e a coes o em textos cient ficos efetivada lexicalmente O reticulado conceitual no caso do experimento serve de base ontol gica para se aprender as estruturas primitivas da informa o recuperada no caso do modelo testado com atributos intensionais derivados da metodologia CommonKADS tem se uma ontologia de objetos de neg cio para classifica o dos sintagmas extra dos do l xico ver Tabela 6 1 e Figura 6 1 Os objetos do l xico com atributos de tarefa agente e insumo e produto por exemplo se vinculam na ontologia gerada no reticulado da Figura 6 1 a processos de neg cio dos atuais players no modelo anal tico de Porter para Intelig ncia Competitiva observando se que tanto parceiros como clientes ou consumidores herdam esses atributos em conjunto Quanto aos conte dos l xicos super
229. ica que os editores literalmente atribuem ndice de termos para cada e todo artigo ou registro Factiva Lexis Nexis Dialog e outros competidores on line t m continuamente improvisado a capacidade anal tica e de busca de seus arquivos O Factiva inclui as informa es eletr nicas da Reuters contidas no Wall Street Journal tanto quanto uma grande variedade de not cias artigos e outros conte dos contendo aproximadamente nove mil fontes com centenas de milh es de artigos O Lexis Nexis tamb m declara possuir um grande arquivo nesse caso de 4 1 bilh es de documentos armazenados on line Este autor cita ainda declara es de Hart CEO da Factiva sobre o produto da empresa FULD 2007 p 157 A Factiva fornece tecnologia que o ajuda a rastrear uma grande massa de dados utilizando o inteligente ndice da Factiva tanto quanto seus 300 mil c digos de empresas seus 372 c digos geogr ficos seus 426 c digos de assunto 735 c digos industriais Podemos trabalhar com empresas para adicionar c digos taxonomia obtendo acesso para os artigos mais relevantes o que significa que voc deve prestar aten o taxonomia Em pa ses de economia mais desenvolvida como os EUA existe tamb m um grande n mero de Web Portais governamentais como o EDGAR Electronic Data Gathering Analysis and Retrieval Online da Securities and Exchange Commission SEC destinados a publicarem informac es de interesse p blico O EDGAR surg
230. icas Os livros e volumes consolidados por exemplo pela sua caracter stica essencial de aus ncia de not cia ser o mais teis apenas em contextos de conhecimento de fatias da realidade e descoberta do DNA corporativo do neg cio 7 Fuld 2007 por exemplo ressalta inclusive a import ncia de se pesquisar na Web conte dos de maledic ncia das organiza es citando como um endere o com esse tipo de conte do o http www fuckedcompany com 140 A Livros e Volumes Consolidados Informa o de Conhecimento T cito A Congressos Peri dicos de Not cias Peri dicos Especializados World Wide Web aberta World Wide Web invisivel Figura 5 12 Reticulado de Fontes e Usos de Informa o para Intelig ncia Competitiva Fonte do autor da tese 141 6 MOSAICO SEM NTICO PARA INTELIG NCIA COMPETITIVA A intelig ncia pode ser emergente FREEDMAN 1995 Este cap tulo apresenta ao mesmo tempo uma an lise mais detalhada dos modelos de informa o obten veis a partir da An lise de Conceito Formal com os resultados da minera o textual na Web e uma consolidac o desses modelos no construto gr fico conceitual que se denomina nesta tese mosaico sem ntico para suporte ao desenvolvimento de intelig ncia competitiva nas organiza es um cap tulo destinado demonstra o de como a metodologia proposta pode induzir os engenheiros do conhecimento a pensar sobre os conceitos de neg cio minerados criar si
231. iciente de documentos pertinentes extra dos de uma grande cole o que nos dias de hoje pode ser entendida como um armaz m de informa o ou uma base de dados digital de acordo com uma necessidade de informa o espec fica consistindo de tr s processos coleta indexa o e ordena o A coleta um processo de identifica o avalia o e armazenamento a indexa o um processo de categoriza o com uso de palavras chave para representa o de um documento e a ordena o um processo de disponibiliza o de documentos aos usu rios segundo crit rios de representa o que satisfa am suas necessidades A constru o de um SRI que possa extrair consistentemente informa es sem nticas acuradas de todo tipo de texto nem sempre poss vel KONCHADY 2006 constituindo um dos maiores problemas conceituais da RI a ambiguidade de termos ling sticos Meadow Boyce Kraft e Barry 2007 observam que enquanto identificadores nicos s o utilizados para algumas aplica es e indicadores de classifica o em outros casos h incerteza sobre valores ou significados causando confus o ao leitor humano ou a um programa de computador ou ambos E uma fonte de ambig idade a sem ntica o significado dos s mbolos Gottschalg Duque 2005 p 29 apresenta uma solu o metodol gica para o problema propondo que se construam proposi es ou enunciados na matriz aristot lica para a interpreta o sem ntica
232. ico nessa id ia Um m uma frase que combina os elementos da id ia que voc est tentando capturar Os dados do APENSO mostram inicialmente que na amostra de textos estudada o n mero de palavras distintas n o repetidas ou tipos num texto representa apenas uma fra o de todas as palavras utilizadas nesse texto algo em torno de 21 8 na m dia e que medida que os textos aumentam de tamanho em quantidade de palavras ou tokens a propor o de palavras n o repetidas types diminui Este um fen meno conhecido na Ci ncia da Informa o indicando que quanto maior o texto maior a tend ncia de uso repetido de tipos algo que contribui DNA Deoxyribonucleic Acid um tipo de mol cula que codifica a informa o gen tica de um organismo humano e apresenta algumas caracter sticas que o identificam de modo nico da o uso da met fora para ualificar certos tra os informacionais que identificam uma organiza o que publica na World Wide Web 7 O autor considera essa linguagem de busca desenvolvida num contexto de Intelig ncia Competitiva como um segredo empresarial per se 118 para os objetivos desta tese a busca de conceitos expressos com sintagmas complexos resultantes da combinac o de substantivos ou nomes O mesmo fen meno acontece em relac o aos nomes substantivos obtendo se na amostra de textos estudada propor es quase id nticas com uma m dia de 20 2 de nomes substantivos n
233. icular isso recomendado para an lises racionais dos conceitos a priori dos objetos que o integram ou seja an lises onde se busca deduzir as implica es racionais dos conceitos a partir de seus atributos e rela es hier rquicas na rede Esse tipo de an lise poderia levar o engenheiro do conhecimento a questionar por exemplo o significado de um conceito cujos objetos combinassem os atributos de Modelo de Tarefas e Modelo de Insumo Produto como ocorre de fato no reticulado da Figura 5 11 Ou de modo mais complexo ainda o significado de um conceito cujos objetos em extens o apresentassem os 135 atributos intensionais Modelo de Tarefa Modelo de Insumo Produto Modelo de Agente e Modelo de Ambiente Externo Contudo considerando se a extens o do esfor o necess rio as poss veis interpreta es dos reticulados gerados no experimento e dos modelos de informa o visual consequentes em contextos de Intelig ncia Competitiva ser o discutidas no pr ximo cap tulo O item seguinte deste cap tulo apresenta uma introdu o a esses contextos de intelig ncia e suas caracter sticas com base na literatura Figura 5 11 Reticulado de Conceitos sem Objetos Fonte do autor da tese 5 6 5 Intelig ncia anal tica e estrat gica Os ltimos passos do processo experimental expresso na Figura 5 9 consistem na an lise dos conceitos dos reticulados busca de informa es espec ficas
234. idade para que possa ser distinto de outros objetos um estado geralmente dados associados a ele e um comportamento pode se realizar a es com o objeto e o mesmo pode tamb m realizar intera es com outros objetos Como uma linguagem a UML prov um vocabul rio e as regras de combina o de palavras desse vocabul rio para o prop sito da comunica o E como uma linguagem de modelagem seu foco se concentra na representa o conceitual e f sica de um sistema Os criadores da linguagem argumentam que a UML permite tanto a codifica o autom tica ou seja o mapeamento direto de modelos gr ficos em c digos fonte como a engenharia reversa com mapeamento direto de c digos de programa o em modelos gr ficos O vocabul rio da UML cont m tr s tipos de blocos de constru o de modelos coisas rela es e diagramas As coisas s o as mais importantes abstra es dos modelos as rela es ligam essas coisas em conjunto e os diagramas agrupam cole es interessantes de coisas Os quatro tipos de coisas na UML s o classificados em estruturais comportamentais de agrupamento e anota es Os aspectos ou coisas estruturais da UML s o os substantivos nomes que s o tamb m as partes mais est ticas num modelo e envolvem classes de objetos interfaces colabora es casos de uso classes ativas componentes artefatos e nodos Os aspectos comportamentais representam a parte din mica dos modelos da UML
235. iedades dos GCs no mesmo contexto sem ntico anteriormente modelado com uso da UML na Figura 1 2 para a senten a O mec nico conserta o motor do carro Observe se na Figura 3 4 que os ret ngulos podem representar tanto classes de objetos identific veis em substantivos nomes frasais numa senten a de texto como verbos e rela es nominais e verbo nominais Os c rculos com abreviaturas nos GCs significam que o objeto central da senten a que consertar um verbo tem um agente AGNT AGENT que um mec nico e consertar tem um paciente PTNT PATIENT que um motor parte PART 53 integrante de um carro ou o carro possui um componente que um motor Com isso resta evidente o funcionamento do modelo de GC da Figura 3 4 que expressa o pr prio modelo geral de tradu o gr fica para texto de um GC uma linha direta com r tulo R apontando do objeto A para o objeto B deve ser lida geralmente como A tem um R que B ou B um H de A WILLE 1997 p 293 MEC NICO CONSERTAR AUTOM VEL MOTOR Figura 3 4 Exemplo de Gr fico Conceitual Representando uma Senten a Fonte do autor da tese O termo gramatical paciente vem do ingl s patient significando uma pessoa ou coisa que afetada pela a o de um verbo agente de agent AGNT AGENT seria a pessoa ou coisa que realiza uma a o expressa como o sujeito de um verbo ativo ou em uma fras
236. ience instruction computer science research computer simulations computing systems computing systems of the future control of a computer conversion systems goal for all of Heckerman s research human computer interaction intersection of human computer interaction life support systems research platform for sensor networks systems management technology transfer agents technology transfer program manager work in computer security Com a Figura 6 14 t m se fragmentos de modelos de informa o integrados no conceito central de System Como era de se esperar esse um dos conceitos essenciais do neg cio no contexto Microsoft Research ao lado de Computer Figura 6 15 Development ZS Contexto Microsoft Research Life support Conversion Communication Management Figura 6 14 Conceitos Integrados em System Fonte do autor da tese 174 O modelo informacional da Figura 6 14 apresenta alguns conceitos triviais nesse ramo de neg cio como Development of Systems Communications Systems e Systems Management mas tamb m conceitos que merecem at para quem conhece esse nicho de mercado um aprofundamento das investiga es como Computing Systems of the Future Life support Systems e Conversion Systems esses conceitos apresentam portanto maior valor relativo de auto informa o Os primeiros 20 endere os URL de uma s rie recuperados com o Google
237. ig ncia Competitiva para identifica o e representa o de servi os nas organiza es internos ou externos estado resultante da intera o entre duas ou mais entidades formando uma terceira mais abstrata como o pr prio conceito de servi o o conserto do motor de um autom vel ilustrado anteriormente na Figura 1 3 3 3 3 Gr ficos conceituais Gr ficos Conceituais GCs s o estruturas conceituais baseadas na Lingu stica Psicologia e Filosofia que constituem um formalismo para representa o do conhecimento SOWA 1984 LUKOSE et al 1997 O interesse nesse tipo de estrutura de representa o cognitiva no contexto da tese se deve aos recursos de visualiza o pict rica com uso de uma linguagem pr xima linguagem natural requisito de modelagem para propiciar sua compreens o tanto por cientistas e tecn logos da informa o como por usu rios das reas de neg cio nas organiza es Eklund Ellis e Mann 1996 apostam nas estruturas conceituais como uma poss vel interl ngua para representa o do conhecimento ou seja uma linguagem comum compreens vel manipul vel em qualquer dom nio do conhecimento Os GCs desenvolvidos por Sowa 1984 t m origem nos Gr ficos Existenciais GEs de Peirce 1909 e nas Redes Sem nticas da Intelig ncia Artificial QUILLIAN 1968 Peirce talvez devido aos seus estudos de Kant observou em 1866 que o nico modo de se conduzir uma pesquisa metaf sica ser
238. ilustrativo sobre o potencial dos 27 mecanismos de crawler na Web onde um grupo de empres rios do turismo na Regi o dos Lagos no Rio de Janeiro decidiu montar um sistema de informa o baseado em computador on line para mant los atualizados com informag es geo referenciadas sobre pontos de venda mais promissores para seus produtos al m de potenciais parceiros e concorrentes e respectivos modos de opera o 3 2 2 Recupera o da informa o A defini o do termo recupera o da informa o uma tarefa mais simples do que a defini o de informa o isoladamente Capurro e Hj rland 2007 depois de tempos pesquisando as ra zes etimol gicas do termo informa o ao longo da hist ria descobriram mais de 500 significados para o mesmo Capurro desistiu dessa empreitada e hoje se dedica angel tica que o estudo da mensagem MATHEUS 2005 O conceito de recupera o da informa o foi criado por Mooers em 1951 assim definindo os problemas endere ados por essa nova disciplina GOTTSCHALG DUQUE 2005 p 8 a recupera o da informa o trata dos aspectos intelectuais da descri o da informa o e sua especifica o para busca e tamb m de qualquer sistema t cnicas ou m quinas que s o empregadas para realizar esta opera o MOOERS 1951 Gottschalg Duque 2005 p 11 apresenta a recupera o da informa o como o cl ssico problema da recupera o efetiva e ef
239. imais que Darwin trouxe das ilhas Gal pagos para casa e que viveu at 2006 Os objetos da Tabela 3 2 em ACF s o denominados objetos formais e os atributos s o denominados atributos formais sendo que os objetos formais os atributos formais e as respectivas rela es de incid ncia entre eles constituem um construto denominado contexto formal base para a an lise de conceitos formais Observa se na tabela outra propriedade interessante da Conex o de Galois analisando se um grupo de animais como Socks Greyfriar s 41 Bobby e Harriet por exemplo descobre se um atributo comum aos tr s isto o fato de serem animais reais Essa propriedade comum aos tr s mostra que esse subconjunto de objetos formais constitui um conceito formal pois existe uma rela o fechada apenas entre eles no contexto formal o atributo de serem animais reais E como consequ ncia nesse conjunto n o se pode nem aumentar a quantidade de objetos nem a quantidade de atributos Figura 3 1 Reticulado de Conceitos de Animais Famosos Fonte PRISS 2005 Outros conceitos formais podem ser destacados da Tabela 3 2 como os objetos Socks e Bobby com os atributos real e mam fero A Figura 3 1 PRISS 2005 que representa um reticulado de conceitos mostra como se pode organizar e interpretar todos os conceitos formais poss veis com os dados da Tabela 3 2 decorrente de um formalismo matem tico que inerente
240. importante ressaltar se tamb m que os parceiros s o considerados como integrantes da pr pria corpora o motivo pelo qual os objetos de ambiente externo n o recebem marca o de incid ncia na respectiva coluna da Tabela 6 1 Como exemplos pode se citar Hu Jintao Administration Takeuchi Keiji automobile manufacturer brokers with the confidence customer demands customer value drivers end user end to end solution for the client health care providers history of helping clients household products retailer 144 innovation to clients oil field operators privacy of the user products to costumers steel manufacturers e outros Estruturas Corporativas organiza o Estruturas Corporativas organiza o tarefa For as do Mercado ambiente extemo tarefa Estruturas Corporativas organiza o insumo amp produto c e ente exte e For as do Mercado ambiente extemo insumo amp produto caon For as do Mercado ambiente externo tarefa insumo amp produto Processos Produtivos agente incorente za ente exte Concorrentes organiza o ambiente extemo Processos Produtivos tarefa agente Processos Produtivos agente insumo amp produto Parceiros Processos Produtivos tarefa agente insumo amp produto Estruturas Corporativas organiza o agente Estruturas Corporativas organiza o tarefa agente Estruturas Corporativas organiza o agente insumo amp produto Estruturas Corporativas or
241. inada Processamento da Linguagem Natural PLN O experimento que embasou esta tese se tornou vi vel somente gra as disponibilidade de recursos de software de PLN com capacidade para realiza o de minera o de texto com associa o de padr es existentes na linguagem natural collocation concgram e outros Como restou evidente no experimento parece que existem ainda padr es sint ticos e sem nticos a serem descobertos nas estruturas desse universo da informa o registrada aguardando esfor os de pesquisadores com paci ncia e talento para desvend los A segunda grande quest o de Bates 1999 se relaciona ao ser humano e seu comportamento informacional que acaba produzindo os padr es de texto teis em projetos com uso de PLN para engenharia da informa o e do conhecimento Como discutido no Cap tulo 5 as organiza es apresentam em seus Web Portais uma mensagem para o mundo que contem na ess ncia o seu pr prio DNA informacional FULD 2007 com atributos que devidamente analisados podem levar o Engenheiro do Conhecimento a um aprendizado til para Intelig ncia Competitiva Esse tipo de pesquisa sobre o comportamento do usu rio da informa o nos reposit rios digitais sempre representou uma rea de interesse na Ci ncia da Informa o e atualmente teve Esse lema de Bates 1999 similar ao de Fuld 2007 em rela o Intelig ncia Competitiva com informa es da Web siga as transa
242. inerados dos textos de tr s organiza es de um mesmo nicho de mercado que ser o analisados em conjunto no Cap tulo 6 como uma simula o pr tica de Gest o da Informa o e do Conhecimento num ambiente de Intelig ncia Competitiva importante destacar se neste ponto algumas propriedades estruturais interessantes dos contextos elaborados com essa metodologia Indexa o tem tica como os sintagmas plurinominais representam expressiva parte dos substantivos nomes presentes nas colet neas os contextos podem ser utilizados para recupera o de informa o do neg cio publicada nos Web Portais corporativos em algumas situa es os contextos de objetos sintagm ticos podem funcionar tamb m como listas invertidas de busca a partir de um conjunto de objetos como no caso do substantivo business que pode remeter o usu rio a dezenas de objetos contendo esse termo em sua composi o sintagm tica como business applications business decision business goals business networks etc Il Apresenta o poliss mica dos substantivos nomes com os sintagmas plurinominais observam se com frequ ncia os mesmos substantivos compondo mais de um sintagma mostrando se as possibilidades sem nticas utilizadas nos textos inclusive as 133 op es mais frequentes no contexto essas possibilidades como se observou no experimento geralmente s o poucas devido ao pr prio contexto do neg cio Ill Popula o de ontologias com
243. ing sticas estat sticas e de Intelig ncia Artificial para extra o de objetos e rela es de documentos textuais e o aprendizado de ontologias culminando com o povoamento de rvores hier rquicas de conceitos Conforme Cimiano 2006 o termo aprendizado de ontologias uma cria o de M dche e Staab 2001 historicamente correlata id ia de Web Sem ntica que pode ser descrita como a aquisi o de um modelo de dom nio a partir de dados O aprendizado ontol gico pode ser entendido grosso modo como um processo de engenharia reversa onde inicialmente o autor do texto teria formalizado por meio de linguagem natural suas id ias acerca de um certo dom nio epistemol gico e no aprendizado tenta se resgatar essas id ias e mostr las como uma representa o de conceitos em suma essa reengenharia seria a reconstru o do modelo de mundo do autor do texto O processo pode ser compreendido a partir do tri ngulo de significa o de Sowa 2000 com base nas no es distintas em alem o de sentido Sinn e refer ncia Bedeutung de Frege conforme a representa o da Figura 3 12 onde se tem um exemplar de gato objeto como uma inst ncia do conceito desse animal dom stico exemplar que conhecido como Yojo nome que um conjunto de s mbolos ling sticos utilizado como refer ncia ao animal Em outras palavras o 65 autor de um texto conhecendo um conceito de coisas no mundo descreve um objeto
244. inguem entre todas as outras organiza es com presen a na rede mundial de computadores Esse material bruto necessita no entanto ser lapidado para que possa mostrar aos engenheiros do conhecimento seu potencial de alavancagem cognitiva e gera o de insights Conforme a metodologia proposta os objetos dessa lista classificados mediante An lise de Conceito Formal compor o os conceitos agrupados no reticulado de conceitos Esses agrupamentos de objetos em conceitos e os relacionamentos entre conceitos constituir o a base de informa o o ponto de partida conceitual para o desenvolvimento de an lises e insights posteriores num ambiente de Gest o de Conhecimento apoiando a Intelig ncia Competitiva numa organiza o Contudo uma quest o precisa ser resolvida inicialmente antes da elabora o do contexto para An lise de Conceito Formal qual o modelo de classifica o de objetos mais adequado a ser adotado Ou seja com quais atributos dever o ser classificados todos os objetos sintagm ticos da lista 5 6 1 Sele o de categorias A Figura 5 9 apresenta as atividades do processo experimental da Parte Il An lise de Conceito Formal onde se busca conhecer os conceitos mais promissores de e sobre uma organiza o publicados em seu Web Portal Corporativo E a partir desses conceitos esparsos pretende se desenvolver um modelo conceitual integrado que possa servir de plataforma de Gest o do Conhecimento tendo com
245. ion we present an innovative methodology for conceptual mining and modeling of textual information relevant to a praxis of knowledge management to support the development of Competitive Intelligence in organizations The methodology is experimentally tested with computer simulation employing features integrated Artificial Intelligence software in Natural Language Processing and combining contents of several areas of scientific knowledge as Linguistics Philosophy Mathematics Psychology Computer Science and Engineering compounding a technological and epistemological multidisciplinary construct of Information Science The Shannon s 1948 concept of self information and the Bateson s 2002 Weick s 1995 and Choo s 2003 concept of difference that makes a difference on the most relevant information are central to the process of creating meaning and the nature based Artificial Intelligence s principle of emergent intelligence guides the process of supporting knowledge construction proposed in the thesis The products resulting from the application of the methodology are pictorial ontological models with classes objects and relations populated with complex phrases extracted from the digital texts inspired by the ideas of Gottschalg Duke 2005 These models feature the most relevant concepts and relationships in business contexts in order to stimulate cognitively the knowledge engineers in their mental processes of creating meaning and constructing
246. ions encourage the autonomy and independence of their local subsidiaries and promote the localization 162 of personnel It is also critical that these companies be aware of the compatibility of Japanese style business with China 6 1 2 3 Modelos de informa o do contexto IBM Research Os 18 objetos sintagm ticos minerados no contexto IBM Research representando os 2 5 de substantivos mais frequentes s o ver APENSO III B application performance diagnosis capabilities for performance monitoring and system management container logistics optimization disclosure management system delivery and tracking systems decision support systems device management systems healthcare delivery and tracking systems healthcare systems inventory optimization with SAP NetWeaver Jayant s research interests Mary s work in software reliability engineering production systems shopping assistant technology system management tool in decision support systems tracking systems warning systems for automobiles evidente nesse conjunto l xico uma concentra o expressiva de sintagmas compostos inclusive com o substantivo system Assim pode se representar os poss veis relacionamentos conceituais desse contexto com o modelo de classes da Figura 6 12 Os fragmentos de modelos de informa o integrados na Figura 6 12 mostram coisas evidentes a priori mas tamb m aspectos que podem se tornar interessantes em contextos de Gest o do
247. ioria delas os ambientes informacionais s o estarrecedores Ningu m sabe o que sabe ou o que precisa saber H pouca informa o acess vel sobre funcion rios clientes e at mesmo sobre os pr prios produtos Mesmo as empresas famosas pela aplica o de sistemas de informa o espec ficos costumam contar com ambientes informacionais internos pobres DAVENPORT 2000 p 16 O problema abordado se insere no ecossistema de neg cios das organiza es complexas e necessita de uma explana o pr via de contexto antes de sua apresenta o de modo mais espec fico O conceito de ecologia da informa o de Davenport 2000 e a experi ncia relatada de McGee e Prusak 1994 como profissionais praticantes da Ci ncia da Informa o oferecem uma vis o panor mica introdut ria bastante consistente no tema apresentando desafios interessantes que motivaram a pesquisa Davenport 2000 p 43 assim sintetiza sua vis o hol stica para abordagem dos problemas de informa o nas organiza es contempor neas com grifos nossos A ecologia da informa o inclui uma gama muito mais rica de ferramentas do que aquela empregada pelos engenheiros e arquitetos informacionais Os ecologistas da informa o podem mobilizar n o apenas designs arquiteturais e TI mas tamb m estrat gia pol tica e comportamento ligados informa o al m de suporte a equipes e processos de trabalho para produzir ambientes informacionais melhores Este ca
248. is acad micas revelando sua natureza multidisciplinar em n vel de gradua o matem tica e qu mica e um p s doutorado A tend ncia do concurso de profissionais com perfil acad mico de Ci ncias Exatas e Engenharias na rea m dica est se realizando numa disciplina denominada Engenharia Biom dica multidisciplinar por excel ncia Quanto ao conceito de Warning System for Automobiles uma busca no Google combinando essa express o com o contexto IBM Research resulta em apenas quatro endere os todos relativos a organiza es de pesquisa e desenvolvimento tecnol gico da holding IBM Corporation O texto dessa p gina apresentado a seguir grifos nossos Telematics provides early warnings about quality issues to automobile manufacturers and dealers The challenge Originally telematics meant the combination of telecommunications and computers Today the term covers the many wireless functions originating from an automobile OnStar which combines a global positioning system and wireless communications to provide safety information and concierge services is probably the best known Many of these systems are purchased because of the safety and security benefits they offer But what if your car could use telematics to continually send information about its performance and tell you the specifics about a problem before you had a breakdown Unlike the ubiquitous Check Engine light this sort of early warning cou
249. is conhecido O m todo desses autores uma variante do algoritmo de extra o de regras de associa o baseado na co ocorr ncia de termos em senten as Conforme Cimiano 2006 p 29 outros autores produtivos nessa linha de pesquisa sao Ciaramita et al 2005 Gamallo et al 2002 e Schutz e Buitelaar 2005 ainda que essas iniciativas tenham apenas arranhado a superf cie do problema Quanto ao problema da popula o de ontologias existem nos m todos e t cnicas mais conhecidos restri es de escala Em geral o problema atacado na abordagem conhecida como Reconhecimento de Entidades Nominadas NER e Cimiano 2006 apresenta um m todo NER Named Entity Recognition 72 alternativo com poder de processamento escalar baseado na Web que ele denomina Learning by Googling A implementa o desse m todo apresentada no paradigma denominado Pattern based Annotation through Knowledge on the Web PANKOW cuja vantagem reside na simplicidade de se utilizar um motor de busca na Web para encontrar padr es l xico sint ticos Os resultados dessa busca s o ent o agregados para se descobrir um conceito apropriado para uma determinada inst ncia conceitual e as anota es sem nticas s o aproximadas analisando se estatisticamente suas respectivas ocorr ncias na Web em face de determinadas estruturas indicando alguma rela o de interesse para a tarefa de popula o de ontologias 3 5 Cria o de significado
250. isso pass vel de representa o com um modelo de classe can nico O token system neste caso o substantivo de base e o token warning o substantivo adjetivador neste caso baseado num verbo na forma ing sugerindo um modelo de informa o conceitual onde System representa a superclasse ou classe base enquanto a classe Warning assume o papel de uma classe de atributos de System Ou seja Warning 199 System um tipo inst ncia ou esp cie de System com atributo Warning em s ntese sistemas de alarmes s o apenas objetos ou inst ncias da classe Sistema Quanto ao objeto systems management trata se de apenas uma inst ncia da classe Management com a classe atributo System pois o token management no caso aparece em segundo lugar na composi o l xica estrutura t pica do idioma ingl s Essa estrutura de posicionamentos de tokens facilita a padroniza o de modelos de objetos sintagm ticos Objetos de Contexto Systems Management Warning System Heckerman s Research eee AN ia Figura 6 2 Modelos de Classe Can nicos Fonte do autor da tese Em outros idiomas como o portugu s essas estruturas tamb m existem ainda que com posicionamentos de tokens diversos Como exemplos em portugu s pode se utilizar os mesmos sintagmas sistemas de alarme gerenciamento de sistemas pesquisas de Heckerman onde sistemas
251. istas de linguagens de programa o de computadores O embasamento filos fico dessa obra se reporta perceptivamente a conceitos kantianos de objeto e refer ncia argumentando os autores que existem rela es naturais entre construtos lingu sticos e estruturas do mundo as quais utilizamos a linguagem para descrever no mundo existem objetos e a es correspondentemente na linguagem existem substantivos e verbos BARNETT KNIGHT MANI RICH 1990 p 52 Apesar do objetivo ambicioso com seu artefato o de elaborar uma s rie de regras gen ricas ligadas a uma abrangente ontologia do conhecimento do mundo esses autores observam tamb m na corrente pragm tica do estudo lingu stico que apesar do mapeamento entre a linguagem como um todo e o mundo objeto do discurso ser algo natural e efetivo n o h a priori raz o para se acreditar que os mapeamentos entre um dom nio restrito e o recorte lingu stico de uma linguagem s o naturais no todo citando exemplos de como isso pode ocorrer Esses experimentalistas assumem que as principais t cnicas de an lise sint tica e pragm tica podem ser aprimoradas com m todos que aumentam sua robustez e apresentam as t cnicas que os suportam denominadas i an lise sint tica baseada em agenda ii recupera o de falhas em an lise sint tica e iii an lise sint tica de subsequ ncias de caracteres de termos A contribui o dos autores importante como refer ncia p
252. ito pequeno de autores atuou nos dois clusters Em outras palavras h muito poucos trabalhos integrados SARACEVIC 1999 p 1 055 Ou seja na pr tica a multidisciplinar Ci ncia da Informa o cisalhada resultando em dois grandes feudos de cientistas um se ocupando predominantemente dos aspectos epistemol gicos de base e outro de aplica es uma ci ncia da informa o b sica e uma aplicada que poderia levar a uma nova engenharia da informa o Conforme Saracevic 1999 Solla Price classifica o primeiro grupo como cientistas da Small Science e o segundo como da Big Science ou seja O primeiro grupo lida com um campo de conhecimento ainda n o consolidado enquanto o segundo se ocupa de aplica es pr ticas interdisciplinares consolidando conhecimentos sedimentados em outras reas do conhecimento tais como a computa o eletr nica a matem tica a estat stica a psicologia a ling stica a biologia e a neurosci ncia Em rela o aos modelos seu potencial como m todo de representa o do conhecimento ressaltado ou revivido por Michaud 2006b na obra organizada por Tarapanoff 2006a Michaud define que um modelo uma representa o externa e expl cita de parte da realidade vista pela pessoa que deseja usar aquele modelo para entender mudar gerenciar e controlar parte daquela realidade navega nos dom nios do conhecimento atual e do conhecimento futuro MICHAUD 2006b p 221
253. itos minerados nas cinco for as de Porter e com isso compreender se a utilidade desses conceitos e suas interrela es para o desenvolvimento de insights competitivos Os objetos atributos e rela es de incid ncia desses modelos fragmentados podem ser obtidos das planilhas de contextos APENSO III A APENSO III B e APENSO III C e dos respectivos reticulados de conceitos das organiza es amostradas com poss veis interpreta es a luz de algum formalismo l xico conceitual EVENS 1988 Essas informa es conceituais ressaltam a posi o da organiza o Fusitsu no mercado asi tico e mostram como pode funcionar a ideia de refor o de aprendizagem de contexto mencionada por Weick 1995 para o Engenheiro do Conhecimento 146 6 1 Fragmentos de um mosaico informacional Conforme Davydov 2001 p 26 o sucesso na utiliza o da informa o de um ponto de vista da ampliac o do ecossistema de neg cios de um modo geral como em qualquer sistema que inclua pessoas e estruturas organizacionais depende de uma efetiva resoluc o de quest es introduzidas pela estreita colaborac o entre os tr s maiores componentes ou aspectos desse sistema corporativo e Financeiros investimentos custos e lucros por exemplo e Tecnol gicos por exemplo a inteira infra estrutura de dom nio do sistema e Organizacionais personagens e seus pap is espec ficos e zonas de influ ncia e responsabilidade por exemplo Esses compon
254. iu na d cada de 1970 nessa poca utilizando papel e microfilmes com objetivo de publicar informa es sobre as empresas de capital aberto nos EUA para evitar um novo crash financeiro como o da Bolsa de Valores de 1929 9 5 CEO Chief Executive Officer Executivo Chefe da Empresa Tradu o aproximada EDGAR Analise e Recupera o de Cole es de Dados Eletr nicos SEC Comiss o de Seguros e de C mbio Obviamente com a nova quebra do sistema financeiro em 2009 questiona se a efic cia dessa medida 100 5 2 2 Evoluc o da Web Com o advento da Internet e da World Wide Web conhecida pelo acr nimo WWW ou simplesmente Web no in cio dos anos 1990 o cen rio desse mercado de informa o de neg cios mudou completamente com impactos espetaculares tanto do lado da demanda como da oferta Em termos de processos produtivos o uso cada vez mais intensivo de TIC Tecnologias de Informa o e Comunica o resultou num novo paradigma de mercado da informa o onde os custos s o dramaticamente reduzidos em rela o ao paradigma sociot cnico imediatamente anterior baseado preponderantemente no papel como m dia de comunica o escrita e na apresenta o oral como m dia de massa nas campanhas de marketing pela televis o O primeiro resultado sens vel dessa revolu o sociot cnica a sobrecarga ou inunda o da informa o em todo o mundo ocidental ainda atraente objeto de estudo em rel
255. iversity of Washington and the University of Oxford to design an effective vaccine for HIV AIDS in which techniques for machine learning are used to identify the most vulnerable parts within the immune system Researchers from the Pontificia Universidad Cat lica de Chile and the Instituto Polit cnico Nacional in Mexico collaborate with Microsoft Research on a project to use computer vision technology to improve quality control in the food industry a key part of the Latin American economy In the Swiss Experiment an international collaboration scientists are using Web based tools developed by Microsoft researchers to view huge quantities of environmental sensor data more efficiently and in richer detail than ever Microsoft Research Asia s eHeritage program works with academic partners throughout the region to apply the latest technologies to aid the preservation interpretation and dissemination of cultural and natural heritage for research education and protection The program has funded more than 10 research proposals over the past several years from universities such as the University of Queensland in Australia and the University of Tokyo In India Microsoft teams with the Molecular Biophysics Unit at the Indian Institute of Science on a project called From Genomics to Function Identifying a number of target organisms such as pathogens that play a key role in the lives of humans researchers are using computers to learn more abou
256. iza o Sint tica 124 5 6 1 2 Categoriza o Aristot lica 125 5 6 1 3 Categoriza o da Engenharia do Conhecimento 128 5 6 2 Classifica o de Objetos Sintagm ticos 131 5 6 3 Elabora o do Contexto 133 5 6 4 Gera o do Reticulado 134 5 6 5 Intelig ncia Anal tica e Estrat gica 136 6 MOSAICO SEM NTICO PARA INTELIG NCIA COMPETITIVA 142 6 1 Fragmentos de um Mosaico Informacional 147 6 1 1 Conceitos e Estruturas Est ticas de Informa o 148 6 1 2 Contextos e Conceitos Comparados 153 6 1 2 1 Diamantes de Conceitos 153 6 1 2 2 Modelos de Informa o do Contexto Fujitsu Research 158 6 1 2 3 Modelos de Informa o do Contexto IBM Research 163 6 1 2 4 Modelos de Informa o do Contexto Microsoft Research 174 6 1 2 5 Fujitsu Research vs IBM Research vs Microsoft Research 181 6 2 Insights para Intelig ncia Competitiva 185 6 2 1 Modelo Cognitivo com Acesso Direto Informa o 188 6 2 2 Modelo Cognitivo Recursivo 187 6 2 3 Sensibilidade Temporal do Modelo Conceitual 190 6 2 3 1 Defini o do Problema Temporal 190 6 2 3 2 Solu o Proposta 192 7 CONCLUS ES E QUEST ES EM ABERTO 195 7 1 Tese e Resultados do Experimento 195 7 2 Modelo de Minerac o Conceitual Proposto 198 7 3 Poss veis Linhas de Pesquisa Decorrentes 201 8 REFER NCIAS 203 APENSOS 214 APENSO Densidade Sintagm tica Plurinominal Amostra de Textos da WWW APENSO Il Frequencia de Substanti
257. iza o estivesse interessada em acompanhar por quaisquer raz es esse mercado e utilizasse para tanto o m todo de minera o conceitual com base em textos de publica o aberta aplicada nos experimentos apresentados nesta tese tendo como fontes 150 publica es digitais com os conte dos do peri dico Exame os resultados apresentariam os seguintes sintagmas compostos com os substantivos mais freq entes 1 cart es de cr dito aparece 17 vezes 2 setor de cart es aparece seis vezes 3 tipos de cart o duas vezes 4 n mero de cart es duas vezes 5 maquininhas de cart es duas vezes 6 n mero de transac es duas vezes Outros substantivos que aparecem nos textos dessa reportagem que poderiam representar num mosaico sem ntico mais que um alerta antecipado uma motiva o para exerc cios de jogos de guerra nas empresas envolvidas com o mercado de cart es de cr dito e d bito no pa s s o tamb m bastante densos em significados tais como entrada de novas empresas fim da exclusividade entre Cielo e Visa embate entre as credenciadoras funcion rio do Banco Central respons vel pela maior transforma o do setor cart es para as massas classes D e E fronteira dos cart es Centro Oeste fim dos mercados aumento da competi o entre as credenciadoras expectativa de mais efici ncia e pre os cart es da bandeira Visa ano zero da competi o empres
258. l 1997 A ess ncia do conhecimento cient fico s o os conceitos Conhecimento cient fico informa o conceitual obtida de textos ensinados em aulas de ci ncias na escola Conhecimento cient fico portanto algo que compreendido e por isso em primeiro lugar um objeto sem ntico FRAWLEY 1993 AGRADECIMENTOS BEN DELL INTELLETTO Quando o Bem do Intelecto entra Ent o a paz est conosco e um suave controle De todos os pensamentos rudes mas um desejo Preenche cada peito para esquecer o ru do Das coisas do lado de fora e submeter a alma Ao banquete da amizade em um clar o noturno Ent o a esta o neste mundo de pecado Que traz nova for a e nos manteve confiantes A despeito das mudan as que causam ansiedade e cansam E quando da sabedoria temos sido andarilhos Ent o aquele estupor roubado do esp rito Das coisas desconhecidas com vis es escuras e terr veis Em sua alta presen a nos restabelecemos Mais que por todos os volumes nas prateleiras T W Parsons apud Roberts 1973 Agrade o e dedico este esfor o em primeiro lugar a Deus grande arquiteto do universo que criou toda a mat ria e energia existentes e nos concedeu a capacidade de perceber a organiza o dessas coisas a informa o Esta tese tamb m dedicada a todos os entusiastas da Intelig ncia Artificial Gest o da Informa o e do Conhecimento e Intelig ncia Competitiva e em especial s pes
259. l sugere que se deve adotar tamb m como padr es sint ticos de busca sintagmas com verbos no infinitivo e substantivos nomes estilo VB DT NNS por exemplo de modo a se elicitar os comandos e ordenamentos normativos caracteristicamente expressos nesse tipo de documento 197 Os c lculos estat sticos tamb m emprestam formalismo metodologia fundamentando experimentalmente a crenca indutiva que suporta as conclus es sobre a efic cia da abordagem de engenharia ling stica adotada na minera o Em relac o ao alcance dos objetivos espec ficos da tese conclui se a que o arsenal de Intelig ncia Artificial tem nos softwares de etiquetagem autom tica de palavras tagging de an lise sint tica de textos parsing e de An lise de Conceito Formal com elabora o de reticulados de conceitos os recursos tecnol gicos de automa o de processos mais cr ticos para a viabiliza o da metodologia proposta condi o sine qua non para enfrentamento do verdadeiro oceano de textos de neg cios dispon veis nos reposit rios digitais da atualidade b os modelos conceituais gerados s o sens veis ao uso frequente de conceitos nos textos minerados podendo se inferir que quando um novo conceito introduzido num Web Portal mediante uma s rie de textos correlatos ele poder ser identificado nos modelos conceituais elaborados posteriormente caso a frequ ncia de seus substantivos nomes alcance certo limiar recu
260. l ticas efeitos situa es resultados Simulac o Figura 4 2 Simula o como M todo Experimental Fonte do autor da tese Os experimentos com simula o computacional podem ser sofisticados envolvendo uso de t cnicas estat sticas se diferentes efeitos podem ser produzidos por exemplo como resultado da intera o de v rias pol ticas quando ent o se deseja analisar os impactos cruzados entre elas E podem tamb m ser bastante simples tomando a forma de quest es e se onde as simula es se destinam a produzir efeitos percept veis no modelo com base em intera es conceitualmente mecanicistas de causa e efeito Pidd 1988 observa contudo que a simula o computacional como m todo experimental de pesquisa consome tempo e geralmente uma tarefa bastante complexa mas apresenta tamb m as seguintes vantagens a custo em geral menor que um experimento real nas organiza es b tempo ap s a modelagem e a constru o do artefato computacional as possibilidades de emula o de situa es reais com simula o s o ilimitadas podendo se tamb m simular per odos maiores de opera es reais em quest o de segundos no computador c possibilidade de replica o um experimento simulado pode ser replicado por outros pesquisadores uma vez que as condi es ambientais s o modeladas e estruturadas de modo intelig vel algo dif cil de ocorrer num experimento real pois as organiza
261. large retail grocery chain With more than 345 stores in the northeastern United States the company was seeking to solidify its customer base and trigger incremental sales Although the grocer already had an existing loyalty card program it wanted a more precise cost effective way to reach customers not after they made their purchases but during the decision making process The company sought a solution that would allow customers to better manage their time in the store help them navigate the aisles quickly and reduce wait times The grocer also wanted to hone its marketing efforts to reach shoppers with relevant targeted promotions as they traversed the aisles The solution was the IBM Personal Shopping Assistant called Shopping Buddy which consists of a data management system Wi Fi network infrared technology and Bluetooth transmissions centered around touch screen computers mounted on shopping cart handles It uses IBM Store Integration Framework IBM WebSphere Application Server IBM WebSphere MQ messaging software IBM Tivoli amp management software IBM Mobile Tablet for Retail as well as Cuesol s Cart Companion browser software monitoramento de desempenho se adaptem s suas caracter sticas tecnol gicas sob pena de n o se viabilizarem na miss o 169 IBM Research teamed with IBM s Retail Store Solution division to assist in prototyping various aspects of the IBM Personal Shopping Assistant for the Store Integratio
262. lculo e a nova ordena o de frequ ncias da Tabela 6 3 podem ser realizados mesmo antes de atualiza o da base comparando se os dados da base com os dados do novo 193 texto minerado Com isso evita se um novo processamento da base toda atualizada poupando se recursos tecnol gicos e humanos Este experimento de atualizac o de base textual no tempo mostra portanto que a metodologia de minerac o e modelagem de conceitos proposta pode dar conta do problema temporal de modo a produzir os resultados colimados Com a t cnica proposta estima se que qualquer novidade sobre o neg cio publicada na Web ou em outras fontes digitais cadastradas pelo engenheiro do conhecimento para minera o textual peri dica poder ser descoberta tempestivamente e tratada adequadamente sob o prisma da Intelig ncia Competitiva Com a capacidade de se calibrar a faixa de frequ ncias dos substantivos nomes que indexam os sintagmas a metodologia permite que se executem buscas em diversos n veis e volumes de conte dos com parcelas maiores ou menores da base textual recuperada E com esse recurso de atualiza o dos conceitos mais relevantes num contexto ao longo do tempo publicados pelas organiza es que atuam em um nicho de neg cios pode se monitorar a concorr ncia numa base permanente e controlada destacando se as informa es que aparecem como novidades em cada busca e que devem portanto receber aten es especiais do engenheiro do conh
263. ld deliver real information to auto owners Add a little bit of intelligence and the early warning could give auto manufacturers headlights into quality issues before they become customer satisfaction problems More importantly this technology could help control the increase of warranty costs which add up to more than 8 billion a year in the United States alone The approach Quality information about cars currently relies on lagging indicators such as warranty costs calls to customer service numbers and dealer service records The trouble is that this information is only available after something has happened Worse there is little automatic communication between original equipment manufacturers OEMs and suppliers that would allow them to work through the causes of current problems and prevent future ones IBM is working on a solution that will combine data from multiple sources and provide manufacturers with an Early Warning System to identify potential problems before they become major liabilities 166 IBM s Early Warning System uses telematics to capture performance and diagnostic trouble code data from cars as they happen These leading indicators are combined with the lagging indicators creating a comprehensive set of information Complex analysis with clustering and data mining is done to identify trends and vehicles that behave abnormally Once a problem is identified OEMs dealers and suppliers will be able to work collabo
264. liente se relaciona com a classe Reserva com cardinalidade um para zero ou um para muitas e tem o atributo reservas simetricamente seria de se esperar que o modelo indicasse que a classe Reserva tivesse o atributo reservante mas reservante no caso um atributo da rela o em si com a anota o possExtrem sob o ret ngulo da propriedade reservante e n o de uma das classes envolvidas Reserva nada conhece sobre reservante Com a UML pode se ainda esclarecer a estrutura dessa rela o com uma representa o denominada reposit rio modelada conforme a Figura 3 10 WEILKIENS e OESTEREICH 2007 p 44 O metamodelo da Figura 3 10 mostra que Cliente e Reserva s o objetos de Classe e que as propriedades reservante e reservas s o objetos da classe Propriedade observando se tamb m um objeto an nimo da classe Associa o 62 As classes s o os tipos de propriedades e essa associa o reconhece cada uma das duas propriedades como uma extremidade da linha de representa o da associa o assocExtrem A associa o descreve um conjunto de tuplas cujos valores se referem s inst ncias da tipologia observando se que a propriedade reservas pertence classe Cliente um atributo desta representado pela anota o possAtributo Em suma na UML o pr prio sentido da navega o na linha de nota o da associa o mostra a
265. linha se refere a objetos e relacionamentos da estrutura de cargos dos rg os p blicos no Brasil conforme a respectiva legisla o e o que se pretende resolver s o os conhecidos problemas do relacionamento m ltiplo entre rg os e cargos e entre pessoas e vagas nos cargos Os objetos mais vis veis no mundo real nesse caso s o os rg os p blicos os tipos de cargos existentes e obviamente as pessoas que os ocupam Ocorre entretanto que a rela o entre um rg o e um tipo de cargo N para N ou seja um rg o pode ter v rios tipos de cargos e um tipo de cargo pode existir em v rios rg os tornando o modelo invi vel caso n o se identifique nenhuma inst ncia de relacionamento entre rg os e cargos E a solu o justamente uma inst ncia de relacionamento entre ambos denominada vaga algo previsto na legisla o que constitui o conjunto de regras do neg cio Figura 3 3 Exemplo de Modelo de Dados Entidade Relacionamento Fonte do autor da tese 50 Com a solu o apresentada no modelo reduz se o relacionamento entre os objetos ou entidades rg o e Cargo a um para N mediante a introdu o de um objeto de media o denominado Vaga pois no mundo real os cargos t m vagas a serem preenchidas e os rg os alocam vagas para cada tipo de cargo em sua estrutura Esse tipo de estrutura no modelo ER pode ser til em ambientes de minera o e modelagem de conceitos para Intel
266. lmente significa uma tradu o na qual uma palavra explicada por outra palavra O processo de cria o de significado voltado tanto para a inclus o da constru o e destaque dos sinais textuais que s o interpretados quanto para a revis o dessas interpreta es baseada na a o e suas consequ ncias Cria o de significado como a elabora o de conte do em rela o interpreta o e como a cria o em rela o descoberta A distin o chave que a cria o de significado trata dos modos como as pessoas geram o que elas interpretam Cria o de significado se refere claramente a uma atividade ou um processo enquanto interpreta o pode ser um processo mas provavelmente apenas para descrever um produto Choo 2003 p 49 citando Nonaka e Takeuchi 1997 entende a dimens o cognitiva da constru o do conhecimento como represent vel por esquemas modelos mentais cren as e percep es que refletem nossa imagem de realidade o que e nossa vis o de futuro o que deve ser Em suma com Choo 2003 p 66 tem se uma elabora o mais completa do processo de constru o do conhecimento nas organiza es O autor reconhece de modo algo po tico que a informa o e o insight nascem no cora o e na mente dos indiv duos e que a busca e o uso da informa o s o um processo din mico e socialmente desordenado que se desdobra em camadas 83 de conting ncias cognitivas emocionais e situ
267. lo evolutivo da WWW com base em observa o emp rica e extrapola o Esse modelo apresentado por Davis 2008 apontando os prov veis caminhos evolutivos da Web at 2020 denominados de onda sem ntica a caminho da Web 3 0 e al m esse artigo tem suscitado debates interessantes na comunidade de entusiastas e acad micos da arquitetura da informa o O ponto de origem nessa evolu o o modelo da Web primitiva com aplica es mais simples voltadas para publica o e busca de informa o em s tios digitais pelo mundo afora cuja tecnologia se destinava a conectar conte dos com endere os de hipertexto na Internet seria portanto a Web 1 0 Essa primeira vers o da Web ainda existe em abund ncia no mundo todo sendo a de custos mais acess veis para pessoas e organiza es que n o necessitam nada al m de suas fun es b sicas A vers o seguinte que denominamos Web 2 0 a Web Social com objetivo de desenvolver meios mais avan ados de conex o de pessoas pela Internet em aplica es de correio eletr nico redes sociais portais de comunidades e outros recursos comum observar se inclusive em portais mais avan ados as caracter sticas desta vers o amalgamadas com as da vers o anterior A Web Sem ntica seria o pr ximo passo nessa evolu o hist rica onde a busca de significados em contextos de Gest o do Conhecimento e Intelig ncia Artificial passa a ocupar as maiores aten es e
268. m importantes efeitos na cria o de significado A sua relev ncia no exemplo da BCS a impressionante diferen a entre a frase mau trato intencional e a frase crian a espancada Esta ltima frase evoca uma imagem gr fica de pais batendo e matando suas crian as A imagem pode mobilizar ultraje e a o O ponto mais geral que palavras v vidas chamam a aten o para novas possibilidades sugerindo que as organiza es com acesso a mais variadas imagens se engajar o na cria o do significado mais adapt vel que as organiza es com vocabul rios mais limitados WEICK 1995 p 3 4 not vel a converg ncia das id ias de Weick 1995 e Bateson 2002 sobre a centralidade do conceito de diferen a ou discrep ncia entre os sinais cognitivos informa o esperados e observados no processo de cria o de significado Citando a obra de Louis Weick 1995 argumenta que Eventos discrepantes ou surpresas disparam uma necessidade de explica o ou de p s dic o e de modo correspondente uma necessidade de um processo pelo qual interpreta es de discrep ncias s o desenvolvidas Interpreta o ou significado atribu da a surpresas E crucial notar se que significado associado surpresa como uma sa da do processo de cria o de sentido mais que emergindo concorrentemente com a percep o ou detec o de diferen as apud WEICK 1995 p 4 5 Como eventos discrepantes pode se depa
269. m CommonKADS tamb m se mostra adequada ao pragmatismo do experimento na medida em que define seu conceito de conhecimento Conhecimento algo intimamente relacionado com informa o Dir amos que o fato de um paciente apresentar a temperatura de 39 0 C uma pe a de informa o e que os m dicos t m o conhecimento para deduzir desse fato que o paciente tem febre De um ponto de vista da engenharia de sistemas conhecimento provavelmente melhor compreendido como um tipo especial de informa o denominado informa o sobre informa o O conhecimento nos diz algo sobre certos itens de informa o E uma forma simples de conhecimento incorporada em hierarquia de subclasses que tem se tornado uma ferramenta comum na modelagem de dados O conhecimento pode ser utilizado frequentemente para se inferir novas informa es n o ha uma linha divis ria bem definida entre conhecimento e informa o Conhecimento apenas informa o complexa tipicamente nos dizendo alguma coisa sobre outra informa o SCHREIBER et al 2000 p 85 86 O m todo CommonKADS estruturado com base numa modelagem do conhecimento em tr s n veis conceituais contexto conceito e artefato Entretanto o n vel de modelagem CommonKADS que interessa a esta parte do experimento que embasa a tese o de contexto onde a informa o dispon vel deve ser classificada em tr s categorias de modelos anal ticos modelo
270. m de sistemas organizacionais competitivos numa velocidade nunca antes experimentada em t o larga escala e tamanha profundidade Schreiber et al 2000 ix por exemplo situam a Engenharia do Conhecimento como um recurso metodol gico para atacar esse tipo de problema nas organiza es contempor neas Gest o do conhecimento uma rea recente na administra o de neg cios que se ocupa de como disponibilizar conhecimento como um bem e um recurso chave nas modernas organiza es Gerir o conhecimento numa organiza o atualmente pouco vi vel sem a explora o do vasto potencial dos avan ados sistemas de informa o e conhecimento De outro lado desenvolvedores de sistemas de informa o e engenheiros do conhecimento tem chegado conclus o que o trabalho t cnico com xito poss vel somente se ele adequadamente situado num contexto organizacional mais amplo Os m todos de engenharia do conhecimento tem gradualmente ampliado seu escopo eles n o s o somente utilizados para o desenvolvimento de sistemas baseados no conhecimento mas tamb m t m mostrado seu valor na gest o do conhecimento engenharia de requisitos modelagem empresarial e reengenharia de processos de neg cio Ent o o objetivo da pesquisa ser o de avan ar numa abordagem de engenharia do conhecimento nos meios de suporte tecnol gico gest o da informa o e do conhecimento em ambientes de Intelig ncia Competitiva elaborando e testando
271. m o esfor o intelectual de pessoal qualificado Esse autor tal como Wilks tamb m criticara conceitos sedimentados de avalia o do desempenho de construtos epistemol gicos e respectivos artefatos tecnol gicos da era pr nternet e o faz mesmo em rela o aos sistemas de recupera o da informa o mais avan ados da poca baseados em redes de computadores com acesso on line Ele questionara por exemplo se os par metros matem ticos de revoca o e precis o seriam ainda os melhores crit rios para avalia o da efetividade de sistemas de recupera o da informa o em ambiente computacional com acessos em rede 8 Essa regra estabelece que na ci ncia necess rio se ter uma teoria completa antes de se ter alguma teoria til 31 O pragmatismo em torno do processamento da linguagem natural cada vez mais presente continuou alavancado na d cada de 1980 principalmente pelos avan os na ind stria de processadores eletr nicos para computadores Ballard e Tinkham 1984 cientistas com um p na academia e outro na ind stria eletr nica trilham o caminho do meio entre a corrente cient fica racionalista e a corrente experimentalista advogando que o projeto de formalismos para serem usados em processadores da linguagem natural transport veis se refere aos aspectos cient ficos tanto quanto aos de engenharia da lingu stica computacional Os autores desenvolvem e implementam experimentalmente um formali
272. m sua rival na rea de servi os de sa de e outra de diversifica o de produtos em ambientes n o competitivos uma com a outra como os mercados de sistemas para microcomputadores no contexto da Microsoft e de sistemas inteligentes para alarmes em autom veis no contexto da IBM Como uma proposta de ontologia ainda mais profunda para esses tr s casos numa vis o avan ada de Gest o do Conhecimento pode se induzir um racioc nio com base 1 no conhecimento que a Fujitsu Research possa ter acumulado em tecnologia digital de suporte a servi os de transporte 2 no conhecimento que a IBM Research possa ter acumulado em sistemas digitais inteligentes e 3 no conhecimento que a Microsoft Research possa ter acumulado em sistemas operacionais para microprocessadores digitais de dispositivos pessoais A ess ncia dessa ontologia profunda ent o se deslocaria do produto em si para o conhecimento nele embutido resultado de dezenas de anos de investimentos em pesquisa e desenvolvimento e de experi ncias de cada organiza o analisada O que se pretende estabelecer com este tipo de tese Que o bvio geralmente informa o importante em Intelig ncia Competitiva pois uma organiza o de porte competitiva no mercado com uma longa hist ria de sucesso tem sempre um n cleo duro de conhecimento acumulado ao longo de muito tempo e sobre o qual toda sua miss o vis o e estrat gias s o elaboradas Os conceitos centrais dos mo
273. m termos de desenvolvimento Davis 2008 de modo simplista caracteriza essa vers o pela conex o de conhecimento algo err neo de um ponto de vista filos fico considerando se que n o se pode conectar o c rebro das pessoas pela Web este modelo de Web que poder ser adotado nas redes digitais internas das organiza es competitivas para publica o dos conte dos estudados nesta tese 103 3 Web Sem ntica Conecta Conte dos de Conhecimento 4 Web Onipresente Conecta Aplica es Inteligentes o t o 1 POM 2 Portais de 8 Web Primitiva P id Web Social Comunidades ES Conecta Informa o Conecta Pessoas 8 Portais Wiki 9 Portais de PA Corporativos Blo 99 Busca gs CR 2o NM Websites Teleconfer ncia ES Correio Redes Sociais 28 Bases de Dados Eletr nico e Aumento da Conectividade Social Figura 5 3 Cen rio Evolutivo da Web Fonte DAVIS 2008 O quarto est gio evolutivo da Web at 2020 conforme o modelo adaptado de Davis 2008 apresentado na Figura 5 3 seria caracterizado por um ambiente de recursos digitais para solu o inteligente de problemas do dia a dia das pessoas e organiza es onde o termo inteligente pode ser entendido como comportamento inteligente e autom tico isto executado por aplicativos de software conforme a necessidade do usu rio Como exemplo desse admir vel mundo novo da Web 3 0 nesse ltimo est
274. ma busca no pr prio Web Portal da Microsoft Research que retorna mais de setenta mil enderecos de documentos versando sobre uma ampla gama de sistemas computacionais considerados futuristas em v rias pocas Computing Systems of the Future da Figura 6 14 pode ser integrado no modelo centrado em Computer como na Figura 6 15 assumindo se que Computing Systems tem um atributo componente denominado Computer apenas substituindo se no caso uma necess ria classe atributo Computing por Computer Outro conceito que desperta alguma curiosidade no contexto Computer Simulation devido ao potencial de uso da simula o baseada em computador como m todo de pesquisa em todas as ci ncias A busca no Google com Microsoft Research and computer simulation retorna nada menos que 11 mil endere os de documentos aproximadamente confirmando o uso em larga escala desse tipo de recurso metodol gico e tecnol gico em v rias reas do conhecimento e o envolvimento dessa organizac o com o tema Conclui se portanto que a maioria dos conceitos correlatos a System e Computer apenas reforcam o aprendizado preliminar sobre o contexto Microsoft Research mostrando conceitos mais bvios e tamb m como os v rios referentes instanciam os sentidos dos objetos sintagm ticos minerados uma vis o mais perif rica do ambiente informacional irradiando se a partir dos conceitos centrais Com os fragmentos integrados no modelo da
275. ma central VI Verificar a consist ncia do modelo completo em rela o identifica o das reais causas e efeitos e seus interrelacionamentos Resultados Insatisfat rios Capacita o Insuficiente Figura 2 1 rvore de Problemas A rvore de problemas deve mostrar uma imagem completa da situa o negativa existente sintetizada na baixa capacidade de compreens o sist mica do ambiente de neg cios como problema central atacado na tese Essa aus ncia de vis o sist mica seria a principal causa da dificuldade que as grandes organiza es t m encontrado na remodelagem de seus sistemas legados de suporte tecnol gico para readapta o cont nua ao ambiente de neg cios mutante BELL 2008 PULIER e TAYLOR 2008 RITTO 2005 HAMMER e CHAMPY 2001 DAVENPORT 2000 DAVENPORT 1993 MCGEE e PRUSAK 1994 2 2 Tese objetivos gerais e espec ficos 2 2 1 Tese A tese defendida pode ser resumida na seguinte afirmativa vi vel estruturar se uma praxis de Gest o do Conhecimento para Intelig ncia Competitiva com base em informa es 16 conceituais relevantes recuperadas de fontes digitais abertas e modeladas a priori das demandas dos usu rios com uso de Intelig ncia Artificial E contrariando outra cren a tradicional na Intelig ncia Competitiva que pressup e a relev ncia como um valor subjetivo de acordo com a necessidade do usu rio da informa o esta tese inclui consequentemetne u
276. ma subtese poss vel separar se a informa o mais relevante num contexto de modo formal n o subjetivo 2 2 2 Objetivo geral O objetivo geral da pesquisa o desenvolvimento de uma metodologia experimental de minera o e modelagem conceitual de informa o textual para uma praxis de Gest o do Conhecimento em ambientes organizacionais de Intelig ncia Competitiva Com essa metodologia pretende se defender a tese proposta apresentando se para tanto uma experi ncia de simula o em contexto emp rico que para Peirce 2010 configura um experimento de retrodu o buscando verificar uma hip tese provis ria O proposto uso da linguagem natural para representa o e comunica o da informa o nessa metodologia se deve necessidade de modelagem de sistemas organizacionais compreens veis tanto por tecn logos de sistemas e informa o como por operadores analistas e executivos de neg cios de modo que os modelos resultantes exer am o papel de uma interl ngua no interior das organiza es EKLUND ELLIS e MANN 1996 2 2 3 Objetivos espec ficos Como objetivos espec ficos a metodologia a ser desenvolvida e testada experimentalmente em laborat rio de simula o computacional dever apontar l Quais recursos do arsenal de Intelig ncia Artificial IA s o mais promissores na miss o de elicita o de conhecimento ontol gico de organiza es a partir de fontes de informa o textuais digit
277. mesmo a extra o de conhecimento de estruturas ling sticas tem se tornado poss vel Outros autores como Prado e Ferneda 2008 definem minera o de textos como a aplica o de m todos e t cnicas computacionais sobre dados textuais com a finalidade de encontrar informa es intrinsecamente relevantes e conhecimento Em rela o s origens da minera o de textos na modernidade Penteado e Boutin 2008 recordam o estudo de textos estruturados para mensura o da publica o cient fica que surgiu e se desenvolveu a partir dos esfor os de pioneiros como Solla Price Small van Raan Swanson Dou e Porter Os autores mencionam que a minera o de textos estruturados encontrada em campos do conhecimento tais como bibliometria cientometria informetria midiametria museometria e webmetria esclarecendo que nesses campos se estuda os diferentes aspectos da informa o inclusive sua qualidade sendo a principal mat ria prima para esses estudos as palavras nos textos Ara jo Jr 2007 expondo a recupera o da informa o em contextos de minera o de textos ressalta que a partir do momento em que as bases de dados s o formadas faz se necess rio o desenvolvimento de mecanismos que permitam a minera o e a identifica o de conhecimento perdido nos textos O autor descreve a tipologia de minera o de textos com nada menos que catorze abordagens metodol gicas onde as que interessam no contexto de engenharia do co
278. mo o mundo dos neg cios e das organiza es ela apresenta uma capacidade promissora de revela o de certas estruturas gramaticais can nicas SOWA 1984 teis para modelagem de sistemas Como discutido no cap tulo seguinte sobre o referencial te rico da tese prop e se um recorte espec fico de uma teoria da estrutura do idioma ingl s com alguma 29 similitude com o idioma portugu s aplic vel linguagem natural t pica do texto organizacional que geralmente um texto estruturado Com esse recorte prop e se um m todo de modelagem autom tica ou semi autom tica de sistemas organizacionais com base na premissa de equival ncia cognitiva entre pensamento e linguagem As estruturas frasais dos textos organizacionais seriam estruturas do mundo dos neg cios e das organiza es com objetos e ac es eventos e relacionamentos Historicamente alguns autores desenvolveram id ias que de certo modo s o atualmente agregadas a construtos epistemol gicos e artefatos computacionais de PLN Wilks 1975 por exemplo situa a prov vel simbiose entre Intelig ncia Artificial IA e uma compreens o da linguagem natural numa abordagem pragm tica argumentando que as limita es metodol gicas de ambas as reas do conhecimento n o devem desencorajar o desenvolvimento de tecnologias para solu o de problemas correlatos O autor previra que essa compreens o da linguagem natural um conceito da poca que embora mais amplo po
279. mo tempo provendo acesso a servi os de dissemina o de informa es espec ficas que podem ser usados para comunica o ou entrega de informa o para um usu rio DAVYDOV 2001 p 57 58 A Figura 5 4 de Davydov 2001 mostra uma classifica o evolutiva dos portais na Web baseada na taxonomia utilizada no mercado Os tr s tipos de portais que interessam a esta tese s o os dedicados originalmente no primeiro n vel de classifica o busca e dissemina o da informa o e o dedicado Gest o do Conhecimento Essa taxonomia arb rea te rica ainda que inspirada na experi ncia em geral coexistindo de modo evolutivo caracter sticas de mais de uma classe em um mesmo portal medida que os Web portais evoluem novas funcionalidades de suporte a servi os s o adicionadas a eles mas algumas funcionalidades de origem n o s o abandonadas mas aperfei oadas tais como a de busca da informa o Contudo como a Web muito vasta os portais de busca se especializaram em portais de informa o para orienta o ao consumidor que s o os mais conhecidos e portais de informa o verticais da industria Vertical Industry Portal ou Vortal O Vortal um s tio na Web para provimento de caminhos para acesso informa o espec fica correlata a um determinado ramo de neg cios do mercado s o portanto portais de busca de informa o mais especializados 105 Os portais para dissemina o da informa
280. modo a forma o de conceitos deve prover i uma defini o intensional de conceitos ii sua extens o e iii os sinais l xicos que s o usados como refer ncia aos mesmos BUITELAAR et al 2004 apud CIMIANO 2006 Quanto s rela es o m todo considera apenas incid ncias bin rias entre objetos e atributos entendendo se como aprendizado de rela es a tarefa de descoberta de identificadores ou r tulos r de rela es tanto como de seu dom nio dom r e amplitude amp r distinguindo se quatro sub tarefas CIMIANO 2006 p 25 e encontrar conceitos conjunto C nos documentos com alguma rela o ontol gica n o taxon mica e especificar as rela es conjunto R encontrando r tulos apropriados e identificadores de rela es com base nos corpora utilizados ou outros corpora de refer ncia teis 40 e dada uma determinada rela o r R determinar o n vel apropriado de abstra o com base na hierarquia de conceitos para o dom nio e a amplitude da rela o e aprender uma ordem hier rquica lt p entre as rela es em R Outro exemplo mais simples de aplica o da ACF o de Priss 2005 apresentado na Tabela 3 2 com o reticulado de conceitos da Figura 3 1 ilustrando as no es de conceitos hier rquicos e de contextos e conceitos formais A tabela mostra as rela es de incid ncia entre os objetos que s o os nomes de alguns animais famosos e alguns de seus atributos Tabela 3 2 Contexto Formal de
281. n Framework An in store retail commerce server prototype was created which integrated the Shopping Buddies the location service and the point of sale terminal controller The service oriented architecture adopted by the in store server provided the basis for the prototyping of various store services such as data replications offer presentations and gift registry The in store server also served as the test environment for the development of the Shopping Buddy prototype In practice customers scan in their loyalty cards to activate a familiar Web style screen with a variety of display options such as sale items or a list of products shoppers buy most frequently A location tracking system monitored through ceiling mounted beacons enables the retailer to pinpoint shoppers locations and deliver relevant real time information as they move through the store The system integrates with the company s backend systems so buying histories and favorite items can be displayed on the screen as a constant reminder of products to buy The device also lets shoppers order cold cuts from the deli sending an alert when the order is ready An attached imaging scanner invites consumers to scan items as they place them in the cart keeping a running total of expenses and savings along the way and completing their transaction using IBM self checkout systems Based on the success of the initial engagement the company plans to extend the technology to as man
282. n Introdu o de mudan as tecnol gicas no setor p blico por onde come ar In KNIGHT Peter Titcomb FERNANDES Ciro Campos Christo CUNHA Maria Alexandra Org e Desenvolvimento no Brasil e no Mundo subs dios e Programa e Brasil S o Caetano do Sul SP Yendis 2007 p 626 638 FRAWLEY William Relational models and metascience n EVENS Martha Walton Ed Relational Models of the Lexicon Representing Knowledge in Semantic Networks Cambridge University 1988 p 335 368 206 FREEDMAN David H Los hacedores de cerebros c mo los cient ficos est n perfeccionando las computadoras creando un rival del cerebro humano Tradu o para o espanhol de Paulina Matta Andres Bello 1995 FREGE Gottlob On sense and reference n RICHARD Mark Ed Meaning Blackwell 2003 p 36 56 FULD Leonard M ntelig ncia Competitiva como se manter frente dos movimentos da concorr ncia e do mercado Tradu o de Jana na Ruffoni Rio de Janeiro Elsevier 2007 GAMALLO P AGUSTINI A LOPES G Clustering syntatic positions with similar semantic requirements Computational Linguistics v 21 n 1 2005 p 107 145 GAMALLO P GONZALEZ M AGUSTINI A LOPES G DE LIMA V S Mapping syntatic dependencies onto semantic relations In Proceedings of the ECAI Workshop on Machine Learning and Natural Language Processing for Ontology Engineering 2002 p 15 22 GANTER Bernhard STUMME Gerd WILLE Rudolf Eds
283. n no original Este um termo utilizado em ling stica l gica filosofia e outras reas do conhecimento com um significado n o encontrado no idioma portugu s e facilmente confundido foneticamente no ingl s com intention substantivo derivado do verbo to intend no sentido de pretender O significado de intens o neste caso o de defini o num n vel mais geral ou seja alguma propriedade ou conjunto de propriedades de um termo que o torna representante de um conjunto de coisas um conceito mais geral como sin nimo de compreens o no sentido de abrang ncia 39 formal O A Com isso pode se tamb m definir uma ordem entre os conceitos formais como segue O A lt Oz Az O c O2 Ac A Conceitos formais s o parcialmente ordenados em rela o inclus o de suas extens es ou de modo equivalente inclus o inversa de suas intens es Cimiano 2006 argumenta que a rela o subconceito superconceito forma uma rede completa B G M 1 lt No exemplo da Tabela 3 1 excurs o viagem reserva ades o representa um conceito formal mas outros conceitos sao por exemplo bicicleta reserva aluguel dire o selim carro bicicleta reserva aluguel dire o E o conceito formal bicicleta reserva aluguel dire o selim um subconceito de carro bicicleta reserva aluguel dire o As unidades de busca nos corpus de textos que s o insum
284. n and communication use of classification technologies e outros Modelo de Agente compreende os atributos de objetos sintagm ticos que podem ser considerados agentes executores de processos atividades ou tarefas representados por seres humanos organiza es sistemas de informa o ou outras entidades capazes de executar a es na pr pria organiza o ou numa organiza o externa parceira ou n o como exemplos tem se end to end solution for the client automobile manufacturer part to a customer on time policy makers sensor data system design e outros Modelo de Insumo e Produto compreende os atributos de objetos sintagm ticos que se referem a insumos ou produtos dos processos produtivos da pr pria organiza o ou de organiza es externas parceiras ou n o excetuando se aqueles que podem ser dispon veis a qualquer organiza o como recursos naturais pessoas estat sticas publicadas etc podendo se referirem a objetos do mundo f sico como em conference hall container logistics optimization device platforms research facilities ou objetos abstratos como em entity analytics e science efforts growth plan help of IT solutions product cycles times e outros Modelo de Ambiente Externo compreende quaisquer atributos de objetos sintagm ticos de organiza es posicionadas no ambiente externo pr pria organiza o analisada 130 excluindo se aqueles que se referem a objetos gen ricos que podem se relacion
285. na Web podendo se afirmar que o ingl s o idioma dos neg cios na rede mundial de computadores A amostra composta de conte dos de informa o em linguagem natural de Portais Corporativos de organiza es consideradas na maioria entre as 500 maiores do mundo em 2009 13 delas na lista Global 500 parte delas classificadas tamb m na lista Fortune 100 seis delas Essas classifica es ordenam as organiza es pelo volume monet rio de receitas anuais em US milh es mostrando tamb m o volume de lucros anuais Os ramos de neg cio representados na amostra s o livraria e conte dos digitais uma empresa banco duas empresas ind stria qu mica e farmac utica uma empresa advocacia uma empresa ind stria de equipamentos fotogr ficos uma pesquisa em hardware e software tr s com rcio de alimentos uma cervejaria uma siderurgia e constru o naval uma ind stria petrol fera uma ind stria de hardware para computadores digitais uma hipermercado uma Dessa amostra as quatro organiza es que n o constaram da lista Fortune 500 em 2009 s o as de advocacia com rcio de alimentos e ind stria de hardware para computadores caso todas as organiza es selecionadas estivessem na lista Fortune 500 a amostra corresponderia a 3 desse universo O crit rio de sele o dessa amostra se deve em parte lideran a e representatividade dessas organiza es em suas reas de neg cio e em parte
286. nados em meios eletr nicos E que In meras novas p ginas contendo textos s o lan adas diariamente na Web Outros tipos de documentos como relat rios de acompanhamento atas de reuni es e hist rias pessoais s o periodicamente gerados e atualizados Entretanto at pouco tempo atr s essas informa es em formato de textos n o eram usadas para significar algum tipo de vantagem competitiva ou mesmo como suporte tomada de decis es ou ainda como indicador de sucesso ou fracasso Com o advento da minera o de textos a extra o de informa es em textos passou a ser poss vel e o imenso e crescente mundo dos textos est come ando a ser explorado Em virtude desse crescimento cont nuo do volume de dados eletr nicos dispon veis t cnicas de extra o de conhecimento autom ticas tornam se cada vez mais necess rias para valorizar a gigantesca quantidade de dados armazenados nos sistemas de informa o EBECKEN LOPES COSTA 2005 p 337 O cap tulo de livro desses autores apresenta uma introdu o conceitual s metodologias mais comuns de minera o de textos classificando as em dois grandes grupos com abordagens diferentes sem nticas que dependem do idioma e estat sticas Outros pontos de interesse nessa obra s o a discuss o das etapas da minera o de textos i prepara o de textos para minera o envolvendo o conceito de recupera o da informa o ii processamento de dados textuais apresentando os
287. nar uma maior capacidade de compreens o dos problemas da organiza o no seu nicho de competi o e a constru o de um ambiente de informa o mais adequado para a gera o de insights de Intelig ncia Competitiva a priori das demandas dos usu rios Como resultado espera se tamb m o aumento da efici ncia operacional relacionado remodelagem dos processos e servi os maior capacidade de mudan a relacionada readapta o sociot cnica e a consequente atualiza o tecnol gica propiciada pelo desenvolvimento dos outros dois fatores correlatos O projeto tamb m se fundamenta em termos de relev ncia nas implica es sociot cnicas e econ micas negativas decorrentes da estagna o evolutiva da gest o da informa o e do 6 nas organiza es complexas com preju zos econ micos conhecimento abaixo da linha d gua e desperd cios de oportunidades E do ponto de vista do m rito acad mico no desafio intelectual de desenvolver uma solu o tanto gen rica quanto poss vel para um problema considerado complexo na modelagem de recursos informacionais superando as limita es dos estudos de casos na Ci ncia da Informa o O conceito de conceito KEIL e WILSON 2000 representa nesta tese a cola a chave epistemol gica para integrar a enorme massa de informa o digital dispon vel em construtos gr ficos de suporte ao desenvolvimento de intelig ncia nas organiza es Conceitos s o id ias que
288. nceitos expressos muitas vezes por termos abstratos tais como sistema de sa de gest o da cadeia de suprimento intelig ncia de neg cios e outros a distin o de referentes e sentidos um requisito na minera o de conceitos algo que se relaciona no jarg o t cnico da recupera o da informa o para popula o de ontologias como desambigua o ou resolu o sem ntica Essa trilogia ling stico cognitiva de Frege 2003 p 38 39 completada com a no o de ideia ou pensamento thought O referente e o sentido de um s mbolo devem ser diferenciados da ideia associada Se o referente de um s mbolo um objeto percept vel pelos sentidos minha ideia do mesmo uma imagem interna surgindo de mem rias de impress es dos sentidos que tenho tido e de atos internos e externos que tenho desempenhado Isto resulta em decorr ncia numa variedade de diferen as nas ideias associadas com o mesmo sentido Este tipo de preocupa o com ideias sentidos e referentes no uso e na interpreta o de textos numa etapa pr via ao da cria o de significado aparece naturalmente na minera o de conceitos como ser mostrado no experimento que embasa esta tese O destaque de informa o relevante resultante da minera o no caso deve decidir se a informa o relevante que se revela por contraste ou diferen a com o estoque de informa o dispon vel ao engenheiro do conhecimento
289. ncer a uma associa o E um atributo um elemento dado que igualmente contido em cada objeto de uma classe e representado por um valor individual em cada objeto n o tendo identidade externamente sua rela o de pertencimento ao respectivo objeto A Figura 3 9 ilustra uma rela o de associa o ou nota o opcionais entre um objeto da classe Cliente e seu atributo reservas de duas maneiras e tr s modos de representa o na primeira op o tem se uma rela o de associa o entre uma classe Cliente e uma classe atributo Reservas onde a classe Cliente tem uma propriedade denominada reservas sobreescrita seta A seta indica a dire o da navega o do objeto para seu atributo e a nota o de cardinalidade 0 indica que cada cliente pode ter nenhuma reserva ou qualquer n mero de reservas na organiza o Com a segunda op o o atributo reservas aparece apenas como uma anota o de atributo dentro do ret ngulo da classe Cliente reservas Cliente Reservas 0 Cliente reservas Reservas 0 j reservante reservas Cliente m Reserva Figura 3 9 Atributo como Associa o ou Nota o Fonte WEILKIENS e OESTEREICH 2007 O terceiro modo de representa o dessa rela o na Figura 3 9 esclarece melhor a quest o sobre a quem a quais classes pertencem o atributo reservas e seu sim trico reservante a classe C
290. ncial da cria o dos mapas mentais que a reflex o acerca da poderosa capacidade dos computadores para estabelecer rela es entre a palavra e a imagem e trabalhar em conjunto com ambas o c rebro tem mais capacidade Buzan 1996 87 Finalmente indica se como origem dos mapas mentais o pensamento criativo ou brainstorming pois o mapa mental uma manifesta o do pensamento criativo As no es de associa o e nfase ou relev ncia se encontram na ess ncia da metodologia de minera o e modelagem de conceitos proposto nesta tese Com esses argumentos pode se compreender tamb m por exemplo porque o Centro para Sistemas Adaptativos do Departamento de Sistemas Cognitivos e Neurais da Universidade de Boston uma unidade de pesquisa acad mica em Intelig ncia Artificial e Neuroci ncia com interesses que intersectam disciplinas tradicionais t o distintas quanto a Biologia Ci ncia da Computa o Engenharia Matem tica e Psicologia Os principais pesquisadores desse centro desenvolveram 14 Ver http cns web bu edu about cas html 13 um tipo de redes neurais artificiais emulando o que se conhece sobre os sistemas neurol gicos do aprendizado humano as redes ART CAPUANO 2009 CAPUANO e NEHME 2002 e atualmente se dedicam tamb m ao desenvolvimento de sistemas inteligentes para apoio a pesquisas neurais na rea biom dica 1 5 2 Oportunidade Quanto oportunidade ela se apresent
291. nderjeet RICH Elaine Knowledge and Natural Language Processing Communications of the ACM v 33 n 8 p 50 71 ago 1990 BATES Marcia J The invisible substrate of Information Science Journal of the American Society for Information Science v 50 n 12 p 1 043 1 050 out 1999 Dispon vel em http www gseis ucla edu research bates1 html Acesso em 15 set 2007 BATESON Gregory Mind and nature a necessary unity Cresskill New Jersey EUA Hampton 2002 BELEW Richard K A connectionist approach to conceptual Information Retrieval Association for Computing Machinery 1987 BELL Michael Service oriented modeling service annalysis design and architecture Hoboken New Jersey EUA John Wiley amp Sons 2008 BENABDELLATIF M Process modelling analysis comparison between activity oriented models product oriented models and decision oriented models In ZANASI A BREBBIA C A EBECKEN N F F E MELLI P Data Mining Ill Southampton Boston WIT Press 2002 p 251 258 BERRY Michael W Ed Survey of Text Mining clustering classification and retrieval Springer Science 2004 BISSON G NEDELLEC C CANAMERO L Designing clustering methods for ontology building the Mo K Workbench n Proceedings of the ECAI Ontology Learning Workshop 2000 p 13 19 BITNER Mary Jo BROWN Stephen W The evolution and discovery of services science in business schools Communications of the ACM v 49 n
292. ner Group Research 8 out 2004 NAVIGLI R VELARDI P Learning domain ontologies from document warehouses and dedicated websites Computational Linguistics v 30 n 2 p 151 179 2004 NEVO Dorit WADE Michael R How to avoid disappointment by design avoid market failure by aligning system performance with stakeholder expectations Communications of the ACM v 50 n 4 p 43 48 abr 2007 NONAKA Ikujiro TAKEUCHI Hirotaka Cria o de conhecimento na empresa como as empresas japonesas geram a din mica da inova o Tradu o de Ana Beatriz Rodrigues e Priscilla Martins Celeste 16 ed Rio de Janeiro Elsevier 1997 OLIVEIRA Saulo Barbar de Org Gest o por processos fundamentos t cnicas e modelos de implementac o Rio de Janeiro Qualitymark 2004 ONTORIA A DE LUQUE A G MEZ J P R Aprender com mapas mentais uma estrat gia para pensar e estudar Tradu o de Silvia Mari ngela Spada 2 ed S o Paulo Madras 2006 ORTEG N Edgar PACHECO Juan Francisco PRIETO Adriana Metodologia del Marco L gico para la planificaci n el seguimiento y la evaluaci n de proyectos y programas Instituto Latinoamericano y del Caribe de Planificaci n Econ mica y Social ILPES Chile Comissi n Econ mica para el Desarollo de la America Latina y Caribe Naciones Unidas jul 2005 PAULA FILHO Wilson de P dua Engenharia de Software fundamentos m todos e padr es 2 ed Rio de Janeiro LTC 2005 PE
293. nery ACM em comemora o aos 50 anos desse texto hist rico publicado no Atlantic Monthly que serviu de refer ncia tem tica num simp sio acontecido em outubro de 1995 em homenagem ao vision rio engenheiro do Massachussetts Institute of Technology MIT creditando se a Bush entre outras coisas o pioneirismo de id ias t o paradigm ticas como o hipertexto os grupos de trabalho em redes de computadores workgroup e a teoria das interfaces IBIBLIO 2007 Esses autores apresentam excertos do texto original de Bush que motivou o desenvolvimento da ci ncia e da tecnologia da informa o desde ent o e observam a similaridade entre o contexto ambiental da gest o da informa o em 1945 nos EUA e na atualidade Bush ressaltava por exemplo que h uma nova profiss o de pioneiros aqueles que encontram deleite no estabelecimento de caminhos teis no meio da enorme massa de registros comuns SIMPSON et al 1996 p 50 algo bastante familiar no atual cen rio de explos o da informa o DAVENPORT 2000 p 11 O atual cen rio econ mico entretanto difere um pouco do per odo p s guerra de Bush pois se os recursos informa o e conhecimento s o hoje reificados como armas estrat gicas para a competi o no mercado global observa se que as TIC encontraram seus limites sociot cnicos naturais como a outrora principal alavanca do desenvolvimento das organiza es complexas Este tipo de cr tica s T
294. ngente no artigo de Silva et alii 2005 O texto propositivo apresentando um framework conceitual de Gest o da Informa o e do Conhecimento para o desenvolvimento de sistemas complexos com inspira o nas metodologias KADS e CommonKADS Em rela o ao instrumental metodol gico para gest o do conhecimento no contexto da pesquisa tamb m existe uma vasta cole o de obras publicadas na ACM e outros reposit rios eletr nicos Os textos abordam com frequ ncia temas com enfoques ontol gicos relacionados com a produ o de mapas de informa o em dom nios espec ficos ou na WWW tema popularizado como Web Sem ntica Ou ainda temas correlatos representa o do conhecimento outro campo de pesquisas tradicional mas ainda atraente na academia Os artigos de Auer 2006 Cantele et al 2006 Lee 2005 Gomez P rez e Corcho 2002 De Ville 2001 e Brachman e McGuinness 1988 apenas ilustram a prolifera o de publica es correlatas 3 3 2 Modelo entidade relacionamento O denominado Modelo Entidade Relacionamento MER integra uma metodologia de modelagem de dados para o desenvolvimento de sistemas de software que come ou a evoluir desde a d cada de 1970 representando atualmente uma corrente doutrin ria da an lise de dados ainda bastante robusta mesmo tendo como concorrentes as metodologias de desenvolvimento de sistemas orientadas a objetos 00 E prova disso que o que mais se observa na ind stria do software s
295. nhecimento desta tese s o as de descobertas baseadas na extra o de passagens an lise lingu stica associa o entre passagens estruturas de textos e agrupamento ou generaliza o ARA JO JR 2007 p 55 61 Quanto s fun es que podem ser desempenhadas por sistemas de minera o de textos Konchady 2006 observa que n o h um conjunto padr o definido das fun es desse tipo de 31 Como met fora relacionada ao confronto b blico entre Davi representando os usu rios de informa es e o gigante Golias representando o enorme volume de informa es dispon veis 35 tecnologia O autor no entanto apresenta uma lista de solu es com uso inclusive de minera o de dados para problemas comuns de gest o da informa o busca search extra o de informa o busca de padr es de uso sem ntico forma o de clusters categoriza o constru o de resumos sumariza o monitoramento de informa o organiza o de perguntas e respostas em aplica es de Frequent Asked Questions por exemplo 3 2 5 An lise de conceito formal As no es de contexto formal conceito formal e an lise de conceito formal s o apresentadas nesta revis o de literatura porque representam formalismos matem ticos que embasam a tese do ponto de vista filos fico e cient fico e alguns dos principais pilares metodol gicos da pesquisa experimental executada Contextos formais e conceitos formais geralment
296. ni 2003 denomina de sintagma complexo o sintagma que cont m ora o subordinada onde geralmente se encontram mais de um substantivo nome 10 advento da World Wide Web e o oceano de informa o aberta e dispon vel para uma praxis de Gest o da Informa o e do Conhecimento e intelig ncia de neg cios nas organiza es Bates 1999 p 1 048 seguindo a informa o assim enunciou tr s grandes quest es contempor neas que se apresentam Ci ncia da Informa o As tr s Grandes Quest es podem ser identificadas na seguinte estrutura b sica 1 A quest o f sica Quais s o as caracter sticas e leis do universo da informa o registrada 2 A quest o social Como as pessoas se relacionam procuram e usam informa o 3 A quest o de projeto Como pode o acesso informa o registrada ser executado de modo mais r pido e efetivo Compreende se na tese apresentada uma abordagem de solu o de problema que se refere de certo modo a essas tr s grandes quest es O experimento mostrou por exemplo como se pode em um mesmo projeto realizar uma pesquisa de base e desenvolver um artefato de engenharia utilizando ci ncia e tecnologia da informa o A quest o f sica de Bates 1999 se reporta s descobertas cient ficas de base que nas origens da Ci ncia da Informa o se concentraram na an lise estat stica e sint tica de textos e que atualmente sintetizada numa subdisciplina denom
297. nibiliza o discuss o e socializa o n o t m rivais Fuld 2007 p 131 assim resume esse cen rio a Internet tem um padr o uma forma de pesquisa Esse o cat logo das transa es de neg cios Ao saber onde o dinheiro trocado voc pode encontrar a intelig ncia Essa a vastid o da rede que a torna uma ferramenta de intelig ncia t o poderosa ainda que frustrante E uma estranha combina o de diversas coisas da Baker Library tais como arquivos com a din mica informacional e a confus o de um bazar aberto no Oriente M dio Isto tudo est l conhecimento insight e at mesmo a fofoca maliciosa e o rumor destrutivo Voc precisa encontrar um caminho para enxergar al m das distra es e distor es e selecionar a informa o poderosa que pode estar escondida nos sites das empresas em grupos de discuss o As bibliotecas por ora possuem barreiras artificiais informa o Elas n o podem refletir a natureza da din mica de como a informa o flui As bibliotecas tradicionais podem somente captar o que os editores colocam em seus documentos A maioria dessa informa o limitada pelo que o editor considera incluir ou excluir Al m disso a maioria dessa informa o j est ultrapassada no momento em que chega s prateleiras da biblioteca A informa o da biblioteca por essa raz o n o lhe d vantagem competitiva E somente informa o informa o antiga n
298. nicas evidentes motivos de sua escolha para minera o de textos nesta tese Elimina quase completamente o problema da ambiguidade na recupera o da informa o pois uma express o sintagm tica tende a apresentar naturalmente um maior poder de resolu o sem ntica que um termo isolado Figura 5 1 Il Utiliza como termos de busca os substantivos que sao os componentes sint ticos representativos das coisas do mundo numa vis o ontol gica de contexto ou a express o mais simples dos conceitos em linguagem natural lll A minera o de texto com sintagmas compostos desse modo s o estruturas padr o da linguagem natural que podem ser facilmente modeladas em como argumentos de queries perguntas com softwares especializados em fun es de busca sint tica como a busca de estruturas sint ticas em modo collocation Empresa de Controle de Pragas Controle de Pragas Poder Sem ntico Empresa Controle Complexidade da Estrutura Sintagm tica Figura 5 1 Poder Sem ntico dos Sintagmas Plurinominais Fonte do autor da tese Quando se utilza como termo de busca ou se recupera no exemplo da Figura 5 1 a palavra empresa pode restar a necessidade de qualifica o dessa empresa ou de sua rea de neg cio no mercado O mesmo ocorre com as palavras controle e pragas que unidas pela preposi o de formam a express o controle de pragas que qualifica esse controle
299. niza o tem de seu setor de atua o a estrat gia o mapa da viagem que uma empresa escolhe para alcan ar lucratividade e valor econ mico real e a capacidade o conjunto de recursos corporativos que a empresa traz para o campo de batalha tais como capital pessoas distribui o global sua linha de produtos e uma infra estrutura de informa o FULD 2007 Essa rea do conhecimento constitu da basicamente por cren as emp ricas ou de trincheiras de gurus da Intelig ncia Competitiva como Fuld 2007 Greenwald e Kahn 2005 e outros e algumas diverg ncias de pensamento merecem destaque Fuld 2007 p 60 61 por exemplo n o acredita no modelo de an lise SWOT Strength Weakness Opportunity Threat para o esbo o de estrat gias competitivas O que interessante nos modelos de Porter o fato de estes serem baseados na id ia de que toda empresa parte de um amplo ecossistema industrial e que deve agir nesse ambiente Antes de Porter isto antes do final dos anos 70 um estrategista podia esbo ar as for as fraquezas oportunidades e amea as de uma empresa e comparar as informa es dessas quatro caixas com informa es similares a respeito de seus concorrentes Mas este era um de muitos cen rios o que tornava dif cil enxergar verdadeiramente o efeito que a descri o de uma SWOT tinha sobre outra Isso n o dava garantia de que voc incluiria todos os fatores que pressionavam voc e seu
300. nores com v rtices retos nas bordas de entrada e sa da do modelo representam a entrada garrafas produzidas e a sa da novo pacote de seis garrafas do processo os ret ngulos com v rtices arredondados representam as a es que comp em a atividade os ret ngulos menores ainda situados na ponta das setas 63 denominados pins representam os par metros de entrada e sa da para a execu o das a es o losango vazio representa um ponto de decis o no processo e os dois c rculos conc ntricos um ponto de parada no processo Quando tanto o par metro de entrada como de sa da de uma a o o mesmo utiliza se um ret ngulo maior com v rtices retos com os par metros escritos internamente no caso o par metro garrafa mas com o atributo de rotulada Os par metros s o tamb m escritos abaixo do nome da atividade que escrita no canto superior esquerdo do ret ngulo do modelo O modelo tamb m declara as pr condi es e p s condi es da execu o da atividade com express es colocadas no canto superior direito do ret ngulo da atividade Produ o de Pacote de Seis lt lt pr condi o gt gt Express o bana V Garrafas Produzidas Garrafas lt lt p s condi o gt gt Express o booleana Novo Pacote de Seis Pacote de Seis Garrafas Garrafas cheias cheias E O E Rotular Garrafas Garrafas rotuladas continuar Garrafas Produzidas gt vazias Encher Gar
301. nt real 172 time information as they move through the store Based on a successful trial the retailer is planning to extend the technology to as many as 150 locations Text mining Businesses typically produce massive amounts of unstructured data related to customer interactions and sophisticated tools are needed to analyze the information and put it to use in improving the customer experience The IBM Business Insights Workbench BIW can help clients mine these enormous collections of unstructured data to help companies meet competitive challenges Unlike more conventional search and retrieve tools BIW creates natural classifications taxonomies of the data objects and analyzes them in conjunction with structured information to find trends co occurrences and other insights Clients use the BIW tool to help improve customer retention by identifying and remedying causes of dissatisfaction The tool can help pinpoint underlying problems through analysis of common customer complaints and phone calls and may lead to improved product design as a result In an engagement with a large insurance and financial services company the BIW tool was used to assist in analyzing e mail messages sent by customers regarding their credit card and online banking accounts As a result the company was able to separate out the e mails from disatisfied customers and identify common problem areas for resolution Similarly a major life insurance firm used BIW to
302. ntes Embora n o intencional esse tipo de ontologia seria mais atomista no conceito de Fodor pois os segmentos da linguagem natural minerados com o m todo dispensam geralmente desambigua o pela sua estrutura sintagm tica complexa al m de sua utilidade limitar se ao contexto Intuitivamente pode se argumentar que provavelmente a ontologia superficial apresentar mais pistas para desencadear o est gio de cria o de significado porque ela ter mais objetos com os maiores valores relativos de auto informa o que a ontologia profunda Em geral de se esperar que objetos mais primitivos num contexto que comp em a ontologia profunda sejam mais conhecidos dos analistas que conceitos derivados com as composi es sintagm ticas que geralmente representam as inova es Os conceitos mais profundos dessa ontologia como Computer e System definidos originalmente por engenheiros e bi logos se destinam a ancorar epistemologicamente o racioc nio do engenheiro do conhecimento em tarefas de Intelig ncia Competitiva tanto no sentido indutivo como dedutivo nos contextos em an lise Como exemplo suponhamos que se queira avaliar que tipo de estrat gia uma organiza o como a Microsoft implementaria para um novo produto no mercado observando se a Figura 6 17 tem se dicas importantes os conceitos de 53 no contexto da computador e sistema Como se sabe esses dois conceitos mais primitivos Microsoft
303. ntic com atlantic flashbks computer tech htm gt Acesso em 13 out 2007 CAMPOS Maria Luiza de Almeida Modeliza o de dom nios de conhecimento uma investiga o de princ pios fundamentais Ci ncia da Informa o Bras lia v 33 n 1 p 22 32 jan abr 2004 CANTELE Regina C ADAMATTI Diana F FERREIRA Maria A G V SICHMAN Jaime S Reengenharia e ontologias an lise e aplica o Dispon vel em lt http www Iti pcs usp br publicacoes Cantele etal04 WWS pdf gt Acesso em 22 dez 2006 CAO Tru H CREASY Peter N Universal marker and functional relation semantics and operations In LUKOSE Dickson DELUGACH Harry KEELER Mary SEARLE Leroy SOWA John Eds Conceptual Structures Fulfilling Peirce s Dream Fifth International Conference on Conceptual Structures ICCS 97 Seattle Washington USA August 1997 Proceedings p 416 430 CAPUANO E A NEHME C Chauke Exploring the parameter space of unsupervised ART neural networks for data mining n ZANASI A BREBBIA C A EBECKEN N F F E MELLI P Data Mining Ill Southampton Boston WIT Press 2002 p 461 472 CAPUANO Ethel Airton O poder cognitivo das redes neurais artificiais modelo ART1 na recupera o da informa o Ci ncia da Informa o v 38 n 1 p 9 30 jan abr 2009 CAPUANO Ethel Airton CASAES Julio DA COSTA Julio Reis DE JESUS Magda Sifuentes MACHADO Marco Antonio Intelig ncia Competitiva e suas conex
304. ntinuing to nurture and grow their core customer base At the same time common wisdom indicates that 20 percent of customers account for 80 percent of sales so it s imperative that successful firms identify their most valuable customers and target their efforts toward boosting their satisfaction With those axioms in mind companies are turning to IBM Research Services a collaboration between IBM Research and IBM Global Business Services for assistance in sifting through massive amounts of data to learn what motivates and influences consumers choices and buying patterns and which customers are likely to prove most lucrative IBM Global Business Services then assists clients in transforming that information into the knowledge and insight necessary to optimize their customer relationships In concert with IBM Research IBM Global Business Services offers clients a wide range of expertise techniques and tools geared toward devising customer relationship management CRM strategies that will help cement customer loyalty at the highest levels and provide a competitive advantage over rival firms Customer experience modeling One key to motivating customer loyalty lies in understanding consumer purchasing behavior and identifying the critical success factors that drive sales In one engagement with a large U S retailer IBM took a multidisciplinary approach to 171 developing a state of the art model of consumers decision making processes using
305. nto desempenham pap is centrais Os assim denominados Sistemas Baseados no Conhecimento Knowledge Based Systems s o considerados o principal produto da Intelig ncia Artificial como disciplina em benef cio do mundo dos neg cios Os m todos desenvolvidos no escopo dessa Engenharia do Conhecimento s o utilizados tamb m em contextos de Gest o do Conhecimento Engenharia de Requisitos Modelagem Empresarial e Reengenharia de Processos de Neg cios SCHREIBER et al 2000 O terceiro modelo de categoriza o de objetos testado baseado ent o na Engenharia do Conhecimento o do m todo denominado CommonKADS mencionado anteriormente no Cap tulo 3 Esse m todo promissor porque parte de um princ pio derivado da abordagem pragm tica do modelo de categoriza o proposto a de que uma arquitetura de conhecimento de sistema algo complexo e dependente do contexto E tamb m porque apresenta uma abordagem estruturada baseada em alguns poucos princ pios emanados da experi ncia de especialistas pr ticos em Gest o do Conhecimento Schreiber et al 2000 ressaltam que a abordagem CommonKADS encarada pelos seus idealizadores como uma atividade de modelagem entendendo se um modelo como uma abstra o intencional de uma parte da realidade O conhecimento deve ent o ser modelado em um n vel conceitual de modo independente dos construtos das linguagens computacionais Os conceitos utilizados na modelagem do conhecimento devem se re
306. ntre nomes ou s mbolos de objetos Ele observa que as igualdades a a e a b t m valores cognitivos diferentes porque a primeira de acordo com Kant tem um significado anal tico a priori mas a segunda cont m frequentemente extens es muito valiosas de nosso conhecimento e n o pode sempre ser estabelecida a priori O que Frege 2008 p 36 questiona um ponto chave que interessa ao estudo sem ntico do discurso se entend ssemos a igualdade como uma rela o entre as coisas que os nomes a e b designam pareceria que a b n o poderia ser diferente de a a assumindo se que a b uma verdade O que se quer dizer com a b parece ser que os s mbolos ou nomes a e b designam a mesma coisa de modo que esses pr prios s mbolos estariam sob discuss o uma rela o entre eles seria estabelecida O fil sofo alerta sobre o risco que se corre ao se atribuir s mbolos s coisas pois como essa Assumiu se sign como s mbolo ao inv s de sinal por consider lo mais apropriado no contexto 74 simbolizac o pode ser arbitr ria pode se tamb m consequentemente perder a veracidade factual ou conhecimento expressa pela rela o a b O problema reside no modo de representa o que pode ser diferente apesar de se referir ao mesmo objeto e Frege 2008 p 37 oferece o seguinte exemplo como recurso para esclarecimento desse aspecto D
307. o intelig ncia A Internet reflete mais precisamente a forma como a informa o flui no mundo real do que qualquer arquivo de biblioteca A met fora adotada por Fuld 2007 p 127 para que as vantagens e desvantagens da informa o da Web sejam corretamente avaliadas a de que esse ambiente uma casa de espelhos Contudo mesmo que essa fonte tenha a tend ncia de desviar e confundir o senso de realidade das pessoas ela considerada uma das fontes mais valiosas de intelig ncia Com m todos adequados esse autor sugere que se possa filtrar o enorme volume de informa o da Web com objetivo de se obter informa o til para insights de Intelig ncia Competitiva como discutido no Cap tulo 6 alguns dos m todos apresentados pelo autor podem ser suportados pelo mosaico de informa o conceitual proposto nesta tese Outro aspecto importante a se considerar em rela o Web a sua evolu o conceitual com impactos sociot cnicos evidentes Ding e Xu 2007 defendem a tese que a Web evolui de modo n o supervisionado com base em leis naturais independente do direcionamento pol tico que alguma entidade supervisora internacional tal como o cons rcio World Wide Web Council WWWC pretenda imprimir mesma Esses autores argumentam que uma evolu o natural ocorreu entre a denominada Web 1 0 o modelo primitivo e a Web 2 0 o modelo atual cujos postulados fundamentais s o A evolu o da Web um processo di
308. o alvo a Intelig ncia Competitiva O m todo da An lise de Conceito Formal apresenta propriedades bastante adequadas para a identifica o e estudos de conceitos em quaisquer ambientes de informa o Contudo o modelo de classifica o dos objetos a ser adotado intencional isto vincula se a algum crit rio de utilidade para o engenheiro do conhecimento E neste ponto aparecem op es e dilemas que precisam ser devidamente ponderados previamente para aplica o da metodologia proposta 5 6 1 1 Categoriza o sint tica Experimentalmente prop s se testar alguns desses modelos de classifica o ou de categoriza o de objetos textuais at encontrar se um modelo adequado para os fins da presente tese representando as primeiras duas atividades do processo experimental representado na Figura 5 9 O primeiro modelo de categoriza o testado consistiu na utiliza o dos pr prios 74 Obviamente outras fontes de informa o textual digital tamb m poderiam ser utilizadas como se mostrou no caso do contexto Microsoft Research 124 termos palavras dos sintagmas como objetos e atributos considerando se o primeiro substantivo nome do sintagma como objeto e os demais como atributos montando se assim um contexto puramente sint tico Esse modelo de categoriza o no entanto revelou duas desvantagens avassaladoras para qualquer experimento anal tico e distribui o de atributos e consequentemente de conceito
309. o com a necessidade do contexto suportam aproxima es que devem se coadunar com os seguintes lemas pragm ticos SCHREIBER et al 2000 p 112 Conhecimento pode ser frequentemente usado para se inferir nova informa o Conhecimento apenas informa o complexa tipicamente dizendo nos algo sobre outra informa o O racioc nio sempre tem uma raz o Em outras palavras um importante aspecto do conhecimento o que queremos fazer com ele 5 6 3 Elabora o do contexto O passo seguinte do experimento com base na metodologia de An lise de Conceito Formal se concentrou na atividade de elabora o dos contextos apresentados nos APENSOS III A III B e HI C com uso de software aplicativo de planilha eletr nica Microsoft Excel e de An lise de Conceito Formal Toscanad Essa atividade ap s o procedimento de classifica o dos objetos manualmente n o apresentou dificuldade mas se revelou morosa e tediosa na medida em que a entrada de dados no aplicativo de An lise de Conceito Formal utilizado teve que ser realizada como numa planilha marcando se nas respectivas c lulas de interface do usu rio as incid ncias de atributos em objetos o m dulo de opera o de entrada de dados em lote no Toscanad apresenta certa complexidade e requer tempo considerado demasiado no contexto com formatos de dados de tecnologia propriet ria Observe se que esses contextos mostram todos os objetos sintagm ticos m
310. o da Universidade de Bras lia FRI Fujitsu Research Institute GB Giga Byte GC Gr fico Conceitual GE Gr fico Existencial HP Hewlett Packard HTML Hypertext Markup Language IA Intelig ncia Artificial vii IBM International Business Machines IC Intelig ncia Competitiva ILPES Instituto Latinoamericano y del Caribe de Planificaci n Econ mica y Social KADS Knowledge Acquisition and Documentation Structuring KBS Knowledge based Systems KE Knowledge Engineering MB Mega Byte MED Modelagem Essencial de Dados MER Modelo Entidade Relacionamento MIT Massachusetts Institute of Technology MOODLE Modular Object Oriented Dynamic Learning Environment NER Named Entity Recognition OCR Optical Caracter Recognition OMG Object Management Group OO Object Oriented OR Object Relational PANKOW Pattern based Annotation through Knowledge on the Web PDF Portable Document Format PLN Processamento da Linguagem Natural POS Part of Speech RAM Random Access Memory RCI Recupera o Conceitual da Informa o RFP Request for Proposals RI Recupera o da Informa o RS Rede Sem ntica SCM Supply Chain Management SEC Securities and Exchange Commission SIC Sistema de Informa o Computacional SOA Service Oriented Architecture SRI Sistema de Recupera o da Informa o SWOT Strength Weakness Opportunity Threat TI Tecnologia da Informa o TIC
311. o da arte da Intelig ncia Competitiva construtos metodol gicos de Engenharia do Conhecimento para uma gest o do conhecimento aprior stica nessa rea concentrando se os esfor os em processos de busca da informa o sob demanda em car ter geralmente espec fico ad hoc Fuld 2007 p 25 26 por exemplo alerta para o que ele considera ser o car ter ef mero dessa intelig ncia e sua natureza eminentemente pragm tica a intelig ncia tem um breve instante de vida ela muito pessoal muito customizada quase nica Voc n o pode massificar a intelig ncia Intelig ncia por sua natureza v lida somente por um curto per odo de tempo para poucos indiv duos Uma vez que todos sabem do insight n o h mais insight este se toma uma informa o comum 18 Perde se a oportunidade de destruir o mercado Perde se a oportunidade do elemento surpresa Intelig ncia tamb m um produto muito pessoal j que ajuda a direcionar a forma como voc gerencia e toma decis es Com o desenvolvimento de uma metodologia de Engenharia do Conhecimento para modelagem semi autom tica de sistemas organizacionais espera se que uma organizac o complexa possa alcan ar maior capacidade competitiva e melhores resultados com base numa maior capacidade de compreens o sist mica do ambiente de neg cios com uso da informac o dispon vel Essa amplia o cognitiva em n vel hol stico do ambiente competitivo proporcio
312. o de intelig ncia em estudo Estabelecendo se a faixa de frequ ncia dos substantivos do texto que se pretende sejam representados pelos objetos sintagm ticos pode se operar com conceitos mais centrados ou 198 conceitos mais radiais conceitos mais utilizados pela organiza o em sua mensagem para o mundo ou conceitos com menor nfase mas talvez t o ou mais importantes no contexto Contudo mesmo as atividades que ainda n o contam com tecnologia de automa o podem vir a ser semi automatizadas com algum esfor o de desenvolvimento de softwares especialmente para a atividade de gera o de modelos de classes conceituais Existem atualmente apenas editores de ontologias no suporte a essa atividade recurso tecnol gico muito primitivo ainda que n o pode ser classificado como ferramenta de automa o mas apenas de visualiza o e armazenamento de modelos digitais A cren a na viabilidade da automa o de expressiva parte dessa atividade se fundamenta na verifica o emp rica da exist ncia de padr es de sintagmas nominais que originam modelos de classe can nicos tais como os exemplificados na Figura 7 2 Atividade Manual Atividade Semi autom tica Figura 7 1 Modelo de Minera o de Conceitos de Neg cio para Intelig ncia Competitiva Fonte do autor da tese O objeto conceitual warning system por exemplo apresenta um padr o de composi o sint tica bastante comum no idioma ingl s por
313. o existem muitos substantivos nomes que aparecem com frequ ncia maior que um pode se observar sintagmas plurinominais que permitem a identifica o e popula o de ontologias como exemplo o conceito de client pode gerar numa hierarquia de conceitos um objeto ontol gico pai com os filhos client engagements client experience client projects client solutions client s e commerce client s money etc IV Caracteriza o da organiza o a partir da observa o dos substantivos nomes mais frequentes no contexto pode se descrever a organiza o e seu ambiente de neg cios interpretando se esses substantivos nomes como seus atributos algo como os cromossomos que revelam o DNA da organiza o FULD 2007 V Composi o de operadores de busca os sintagmas podem ser utilizados como sementes sint ticas ou argumentos de busca em outras fontes por meio de browsers softwares buscadores na Web para complementa o da informa o necess ria para a elabora o de conceitos mais ricos em significados com uso eventual de Gr ficos Conceituais envolvendo tamb m verbos e outros funtores sint ticos 5 6 4 Gera o do reticulado A atividade seguinte no processo consiste na gera o do reticulado lattice de conceitos com uso do aplicativo ToscanaJ como o exemplo da Figura 5 10 do contexto da organiza o IBM Research O gr fico apresenta um c rculo na parte mais alta da rede indicando o in cio
314. o fluxo submetem se os textos minera o de informa es com nfase no reconhecimento de padr es sint ticos com utilidade sem ntica no contexto no caso sintagmas complexos e na quarta fase executa se a an lise de conceitos formais no contexto elaborado com os objetos identificados na minera o de texto obtendo se contextos e conceitos formais representados no reticulado de conceitos A quinta fase dedicada sele o e modelagem gr fica dos conceitos que interessam para a modelagem de sistemas de neg cio onde se utilizam t cnicas de An lise de Conceito Formal ACF e de representa o da informa o com a Linguagem de Modelagem Unificada UML E a sexta e ltima fase do fluxo de atividades dedicada ao desenvolvimento de infer ncias t picas de ambientes de aprendizado com os conceitos modelados na fase anterior contrastando os com modelos mentais e conhecimento t cito existente na organiza o Esse aprendizado deve ser eminentemente hermen utico e pragm tico como s o os processos de tomada de decis o nas organiza es complexas buscando se insights teis em contextos de Intelig ncia Competitiva O mecanismo central desse construto de Gest o da Informa o e do Conhecimento a estrutura o de conceitos com uso de modelos gr ficos a partir de padr es sint ticos textuais Como observa Winograd 1983 os padr es e classes gramaticais s o comuns a qualquer linguagem natural e a liberdade dos falantes d
315. o informacional com analysis between on platform agents partindo se da premissa que diagnosis diagn stico um tipo espec fico do g nero analysis an lise Contexto IBM Research ES Performance Application gt Performance On Platform Z Figura 6 13 Conceitos Integrados em Application e Analysis Fonte do autor da tese O modelo integrado da Figura 6 13 sugere para conhecedores do mercado de TIC atributo que se aplica obrigatoriamente aos engenheiros do conhecimento envolvidos com Intelig ncia Competitiva nesse nicho que a organizac o do contexto tem produtos para an lise do desempenho de aplica es de software inclusive em aplica es processadas em ambientes computacionais compostos por diferentes plataformas tecnol gicas como comum em sistemas de informa o em rede telem tica E deixa evidente tamb m que para tanto utiliza agentes de software espec ficos para cada plataforma tecnol gica computacional de modo a capturar informa es de controle de desempenho em pontos determinados da rede Estima se que esses amp 9 O conceito de agente inteligente agente de software ou simplesmente agente em contextos de TIC remonta a pesquisas da d cada de 1970 onde se propunha um software autocontido aut nomo e de processamento concorrente com os recursos de um sistema com miss es espec ficas no ambiente Esse tipo de softwar
316. o o desenvolvimento de um padr o gen rico de avalia o de softwares Os exemplos citados por King s o de sistemas de fun es mais comuns nos prim rdios da PLN tais como os de tradu o autom tica ou tradu o de m quina O texto de Leidner 2003 complementa de certo modo o de King 1996 oferecendo uma vis o panor mica da engenharia de software utilizada no desenvolvimento de aplicativos para PLN O autor explora os conceitos de componentiza o e reuso e seus benef cios assim como as dicotomias utilitaristas entre experimentos e sistemas e ferramentas e estruturas Dale Aliod e Schwitter 2002 discutem um curriculum acad mico adequado para o estudo de PLN a partir de sua experi ncia numa universidade Os autores tamb m consideram PLN como um subcampo de estudos da Intelig ncia Artificial IA e tentam distinguir com base em outros estudos os conceitos de processamento da linguagem natural e lingu stica computacional definindo o primeiro como a rea de estudos com foco nas t cnicas que habilitam m quinas a trabalhar com a linguagem humana e o segundo como um campo de estudos de mesmo objeto mas com interesse em aspectos mais te ricos Lease 2007 da Brown University pioneira na produ o de corpus de l ngua inglesa renova o desafio de se desenvolver melhores sistemas de recupera o da informa o com PLN O autor observa que na pr tica a compreens o da linguagem humana tem permanecido fugaz e
317. o repetidos em rela o ao n mero total de nomes substantivos ver resultados no Gr fico 5 1 Este resultado apenas confirma no ambiente de linguagem natural da Web corporativa observa es anteriores de pesquisadores em textos diversos Entretanto mostra a utilidade de outros padr es sint ticos de textos comuns nesse tipo de ambiente abrindo as portas da Web para a aplica o do conhecimento cl ssico da Ci ncia da Informa o Repetidas n o P2 ho Ld 2 Ss c n o o S 3 c o o i o oO 20 000 40 000 60 000 80 000 100 000 Numero Total de Palavras Gr fico 5 1 Curvas de Repeti o de Termos na Amostra Textual O Gr fico 5 2 mostra a raz o em percentual entre o n mero de substantivos e o n mero de palavras ou termos gerais que aparecem nos textos da amostra com e sem repeti o Observem se as concentra es de pontos em torno da marca de 50 tanto no que se refere raz o entre substantivos e palavras distintas como entre substantivos e palavras em geral as m dias obtidas na amostra de textos para ambos os casos s o de 50 8 e 48 6 respectivamente Outro aspecto interessante nos Gr ficos 5 1 e 5 2 s o as posi es dos pontos do texto da Sun Microsystems um outlier devido ao seu tamanho bem maior que os demais na amostra Os resultados mais importantes obtidos no experimento do ponto de vista de PLN podem ser observados no APENSO Il Frequ ncia de Substantivos
318. oberta e discuss o ontol gica de objetos do neg cio nesse n vel A estrutura geral framework do modelo completo de aplica o do m todo proposto por Cimiano 2006 pode ser analisada na Figura 3 14 O processo se inicia com a an lise sint tica parsing de um texto ou conjunto de textos documentos sobre um determinado dom nio no caso produzidos pela organiza o ou sobre a organiza o produzidos por terceiros na qual se busca extrair conforme Grefenstette 1994 Lin 1998 Gamallo et al 2005 e outros autores estruturas sint ticas como verbo preposi o complemento e depend ncias de verbo objeto e verbo sujeito Considera se para o ciclo de an lise posterior um par de termos composto por um verbo e um sujeito um objeto ou uma frase preposicional Ent o para cada substantivo ou nome aparecendo como cabe alho desses argumentos de busca utilza se os verbos correspondentes como atributos para constru o do contexto formal e calcular no final a rede de conceitos formais concept lattice Em seguida buscando se consolidar n meros menores de contextos a partir da elimina o de varia es sint tico morfol gicas realiza se a lematiza o ou redu o dos termos a suas ra zes ou bases morfol gicas no respectivo idioma como norma do m todo se a palavra n o pertence ao l xico de refer ncia a mesma n o lematizada 68 A pr xima fase envolve a compara o estat stica dos pares de
319. omplexidade do ser humano como indiv duo podem ser compreendidos tamb m numa vers o organizacional como a s ntese de Choo 2003 baseada nos ensaios cognitivistas de Weick 1995 ambos talvez os construtos mais completos acerca dos processos de aprendizado e tomada de decis o no contexto das organiza es O conceito de diferen a t o fundamental para a compreens o da informa o relevante que aparece originalmente nos tratados metaf sicos de Arist teles sobre categorias de coisas que existem no mundo e no S culo XX num construto basilar da engenharia eletr nica utilizado em artefatos tecnol gicos de transmiss o de dados 73 Kneller 1980 argumenta que o homem primitivo estava em grande parte merc da natureza e que talvez o seu motivo mais forte para a investiga o natural fosse atingir a paz de esp rito por meio de alguma explica o plaus vel para os desastres da natureza fen menos que perturbavam seu sistema cognitivo Ele observa que os cientistas ao longo da hist ria parecem ter sido inspirados menos por motivos ticos e pr ticos que por duas emo es primordiais o assombro e o medo Essas emo es se encontram relatadas nos escritos de Epicuro se n o f ssemos perturbados por apreens es acerca de fen menos no c u e a respeito da morte se nada disso nos afetasse de um modo ou de outro e tamb m se n o f ssemos perturbados por nosso fracasso em perceber os limites das dores e dos d
320. on vel em lt http delivery acm org 10 1145 230000 227187 p47 simpson pdf key1 227187 amp key2 210046291 1 amp coll amp dl acm amp CFID 15151515 amp CFTOKEN 6184618 gt Acesso em 13 out 2007 SOWA John F Conceptual structures information processing in mind and machine Reading MA Addison Wesley 1984 SOWA John Knowledge representation logical philosophical and computational foundations Brooks Cole 2000 SPOHRER Jim RIECKEN Doug Ed Services science Communications of the ACM v 49 n 7 p 31 33 jul 2006 STAAB Steffen The Semantic Web revisited IEEE Computer Society p 96 101 maio jun 2006 STONE John A Developing software applications in a changing IT environment Mc Graw Hill 1997 STUMME G Formal Concept Analysis on its way from Mathematics to Computer Science n PRISS U CORBETT D ANGELOVA G Eds Conceptual Structures Integration and Interfaces 10 International Conference on Conceptual Structures LNCS 2393 Berlin Springer 2002 p 2 19 TALEB Nassim Nicholas The black swan the impact of the highly improbable Penguin Books 2007 TARAPANOFF Kira Informa o conhecimento e intelig ncia em corpora es rela es e complementaridade In TARAPANOFF Kira Org Intelig ncia Informa o e Conhecimento Bras lia IBICT e UNESCO 2006 TARAPANOFF Kira Org Intelig ncia informa o e conhecimento Bras lia IBICT e UNESCO 2006b TARAPANOFF Kira Org
321. onceito de ordem mais alta que pode ser usado como base para futura elicita o r pido para se aplicar e f cil de se analisar For a os construtos subjacentes ao entendimento de um especialista a um formato expl cito E uma ordena o pode conduzir o especialista vis o de estrutura do dom nio que ele mesmo n o tinha conscientemente articulado anteriormente A ordena o de conceitos pode descobrir novos conceitos e atributos e a prop sito particularmente til na constru o de um esquema de dom nio em dom nios n o familiares Com a t cnica de laddering os engenheiros do conhecimento poderiam por exemplo contar com especialistas no dom nio do neg cio para dirimirem eventuais d vidas sobre a classifica o mais adequada de um determinado conceito baseado em sintagmas minerados dos textos E com a ordena o de conceitos poderiam desenvolver entre os pr prios membros da equipe de intelig ncia ou envolvendo tamb m especialistas no dom nio v rias sess es para se obter uma m dia de decis es sobre classifica o das inst ncias de conceitos mais problem ticas Contudo entende se que malgrado n o se possa obter precis o absoluta ou algo pr ximo disso em termos gen ricos de classifica es de objetos deve se manter uniformidade de aplica o dos crit rios de classifica o As engenharias em geral como a Engenharia do 132 Conhecimento por exigirem n veis de precis o de acord
322. onderando sobre cr ticas contempor neas obra de Peirce assim contra argumentam O que mais importante certamente tanto na vis o de Peirce como na nossa que aqui h evid ncia de uma emergente e crescente comunidade de pesquisa na qual o potencial heur stico e explanat rio que Peirce viu em sua l gica gr fica caminha de m os dadas com sua vis o de Pragmatismo N o o instrumentalismo do tipo qualquer coisa que funcione que levou Max Horkheimer e Theodor Adorno a abandonar o pragmatismo como quase um segundo pensamento nem o suave relativismo que Richard Horty tem s vezes reclamado como o ponto do pragmatismo E ao contr rio a vis o onde o significado de qualquer proposi o a soma das consequ ncias que seguem de sua aceita o para abreviar a famosa m xima do pragmatismo de Peirce Obviamente os GCs de Sowa surgiram num contexto diferente dos GEs de Peirce e foram desenvolvidos de modo independente das Redes Sem nticas RSs embora esses construtos tenham como objetivo o suporte metodol gico do racioc nio e a constru o de artefatos de Intelig ncia Artificial e Lingu stica Computacional Sowa 1984 apresenta sua fundamenta o te rica dos GCs a partir de uma vis o fenomenol gica de mundo definindo conceitos a partir de algo mais fundamental as pr prias percep es humanas acerca das coisas O conceito de percep o para Sowa 1984 definido como o processo d
323. oration O primeiro endere o _Attp domino watson ibm com odis odis nsf pages solution 10 html apresenta o seguinte conte do tem tico Tough Problems Solved Personal Shopping Assistant Technology guides customers through store aisles suggesting items to purchase pointing out sales and easing or avoiding the check out line It s not uncommon for busy shoppers to lose their place and valuable time amid the dizzying array of products and retail store layouts And retailers in the midst of the business of shopping often let marketing and customer service opportunities slip through their fingers But this is an opportunity they cannot afford to squander The competition to attract and retain customers is a growing challenge so retailers must find ways to establish stronger customer ties and improve the shopping experience Many companies now use loyalty card programs that offer discounts to repeat customers and gather data about their buying habits The success of such programs relies on how companies use and manage that data Many have spent years gathering information with few practical applications hoping that technology would one day catch up with their needs and offer a way to turn data into dollars That day is here IBM Global Business Services IBM Research and IBM Retail Store Solutions teamed with Cuesol an IBM Business Partner to find a way to help turn customer information into useful profitable action for a
324. orma o deve se ao menos sentir se confort vel com ambos os lados dessa tradi o dual Conclui se ent o com fundamento no racioc nio de Peirce 2010 combinando retrodu o com abdu o que a hip tese da tese se confirmou no experimento Esse experimento tamb m serviu de teste para a tese defendida numa abordagem l gico dedutiva tipicamente popperiana que resistiu a uma primeira experi ncia que poderia refut la O experimento poder ser reproduzido formalmente com informa es de outros contextos de neg cio o que mostra assim sua efetiva contribui o para o avan o da Ci ncia da Informa o al m dos estudos de caso Outros argumentos apresentados em defesa desta tese com base no experimento desenvolvido s o os seguintes e a metodologia proposta para minera o de conceitos a partir de conte dos digitais em linguagem natural eficaz e eficiente em contextos de informa o de neg cios mostrando a utilidade de conhecimentos basilares da disciplina Recupera o da Informa o em buscas na World Wide Web como reclamado por Bates 1999 considerando se que em m dia mais de 90 do conjunto composto pelos 2 5 de substantivos mais frequentes em um texto de Web Portal corporativo est o presentes em sintagmas compostos com dois ou mais substantivos e a metodologia implementa uma abordagem de busca identifica o e indexa o textual para recupera o da informa o conceitual relevante algo inova
325. ornia at Berkeley The Microsoft Institute for Japanese Academic Research Collaboration is enabling faculty and students in one of the world s leading economies to combine their tradition of technological development and product innovation with Microsoft s computer science expertise Investing in People Microsoft operates the largest Ph D internship program in the information technology industry Each year nearly 1 000 top computer science students have the opportunity to work at one of Microsoft Research s locations around the world A variety of Ph D fellowship and scholarship programs have benefited hundreds of students worldwide over the past decade In 2008 Microsoft awarded scholarships to nearly 80 Ph D students including 10 through our Graduate Women s Scholarship program We support young computer scientists through an assortment of summer schools student 179 clubs visiting professorships and awards Microsoft Hesearch runs numerous academic conferences and workshops where students and university faculty members can interact and exchange ideas with top computer science researchers in academia government and industry In 2000 the first Microsoft Research Faculty Summit drew 150 participants since then more than 25 000 scientists academic researchers faculty members and students have attended Microsoft Research sponsored summits conferences and workshops held in Asia India the United Kingdom and Latin America E
326. os exercita se este ltimo ramo da Semi tica sobre o qual Peirce 2010 p 46 argumenta O terceiro ramo imitando a maneira de Kant de preservar velhas associa es de palavras ao procurar nomenclatura para novas concep es denomino ret rica pura Seu objetivo o de determinar as leis pelas quais em toda intelig ncia cient fica um signo d origem a outro signo e especialmente um pensamento acarreta outro Como premissa da tese assume se a possibilidade de automa o ainda que parcial do processo de representa o gr fica da informa o extra da de documentos elaborados em linguagem natural com base em modelos conceituais de sistemas Esta premissa comporta tamb m a hip tese do poder multidisciplinar da Ci ncia da Informa o ser suficiente para validar a solu o metodol gica desenvolvida importante tamb m esclarecer se o m todo de se fazer ci ncia adotado nesta tese Como m todo e t cnica a Engenharia do Conhecimento orienta a execu o do experimento e a retrodu o aristot lica teste de uma hip tese A Teoria da Informa o de Shannon SAYOOD 2000 apoiada pelas teses de Bateson 2002 Weick 1995 e Choo 2003 confirmam a possibilidade de integra o dos m todos dedutivo indutivo e abdutivo de racioc nio de Peirce 2010 p 220 no construto elaborado para explicar o processo de cria o de significado a partir da minera o de informa es conceituais Abdu o o proces
327. os pr prios fundamentos da metodologia OO Paula Filho 2005 por exemplo esclarece que o processo unificado Unified Modeling Language UML de modelagem OO independente dos processos de desenvolvimento apresenta como caracter sticas centrais i direcionamento a casos de uso ii a concentra o na arquitetura e iii a interatividade e o incrementalismo Outro autor importante Pressman 1995 explica que importante reconhecer que a OO e a modelagem de dados s o abordagens diferentes com um ponto de vista bastante diferente opini es similares s de Armstrong 2006 e Giguette 2006 E toda a complexidade cognitiva das metodologias OO para o desenvolvimento de sistemas de informa o computacionais SICs abordada com profundidade filos fica na obra de Pesonen 2002 Outra obra interessante para a compreens o das conex es naturais entre modelos e conhecimento a de Lima Marques e Macedo 2006 Esses autores definem que A arquitetura da informa o fornece suporte s a es de gest o do conhecimento medida que visa promover a acessibilidade informa o armazenada para garantir a efic cia do processo decis rio nas organiza es para que a gest o seja eficaz preciso considerar a intera o entre os ambientes informacional organizacional e externo compreendendo a din mica dos fluxos de informa o e mapear os recursos informacionais para direcion los s necessidades de uso Neste conte
328. os de guerra descoberta do DNA corporativo e conhecimento de fatias da realidade e as poss veis fontes de informa o Tabela 5 1 Fontes e Usos de Informa o para Intelig ncia Competitiva Fontes de Informa o Usos em Intelig ncia Competitiva A z Alerta Jogos de DNA Fatias da N Denomina o Antecipado Gene Corporativo Realidade 1 Arquivos P blicos e 2 Congressos e o e 3 Informa o de Conhecimento T cito e e 4 Intercomunica o Pessoal e e 5 Livros e Volumes Consolidados e e 6 Peri dicos de Not cias e e e 7 Peri dicos Especializados e e 8 Publicac es Governamentais e e 9 Programas de R dio e TV e e 10 World Wide Web aberta e e 11 World Wide Web invis vel e e e e 139 O reticulado da Figura 5 12 mostra os conceitos formados com base no contexto da Tabela 5 1 sugerindo se a seguinte interpreta o para essa estrutura conceitual a fonte de informa o mais completa sob todos os aspectos a Web tanto a vis vel como a invis vel postada no final do reticulado ltima caixa de objetos embaixo Essa fonte pode ser til tanto para alertas antecipados como para jogos de guerra compreens o de fatias da realidade de um contexto competitivo e at para descoberta do DNA corporativo das organiza es no mercado Compreendendo se a Web como multim dia essa interpreta o se sustenta na medida em que
329. os introdut rios do texto existiria o risco de tornar a compreens o de sua import ncia a priori algo confuso para o leitor motivo pelo qual optou se por apresent los neste cap tulo do contr rio poderia se chegar conclus o inicial que os t picos cient ficos abordados constituiriam uma mera sopa de disciplinas sem muito sentido pr tico O texto deste ponto em diante mostra os dados e sua interpreta o em contextos ou seja tenta associar seus significados em ambientes de neg cios caracterizados pela competi o Esta abordagem t o gen rica quanto poss vel tamb m utilizada na otimiza o de modelos com vari veis quantitativas onde se busca descobrir o melhor modelo explicativo poss vel de um fen meno mensur vel a partir de dados de contorno para solu o do problema ou de vari veis alvo adotadas como par metros para otimiza o do modelo Entretanto uma quest o primordial deve ser explicitada antes dessa sondagem no mundo real das informa es digitais abertas das e sobre as organiza es como reconhecer as informa es essenciais para Gest o do Conhecimento em contextos de Intelig ncia Competitiva Fuld 2007 p 15 16 apresenta a seguinte met fora como pista para uma abordagem metodol gica dessa quest o N o existe melhor maneira de compreender a perspectiva competitiva do que visitar um museu de arte Preste aten o nas pinturas dos impressionistas A escola dos impressioni
330. os para o modelo de aprendizado ontol gico s o os termos que podem ser palavras simples ou compostos de v rias palavras com um significado conjunto espec fico possivelmente com um significado t cnico num determinado contexto ou dom nio Em tarefas de descoberta de termos para o aprendizado de ontologias consideram se geralmente como termos quaisquer palavras ou conjuntos de palavras relevantes no dom nio estudado Os insumos entradas nesse tipo de processamento de dados s o cole es de documentos em linguagem natural ou computacional representando o dom nio de interesse e os produtos sa das s o conjuntos de s mbolos ling sticos strings Sc e Sr representando termos que ser o utilizados como sinais de representa o de conceitos e suas interrela es respectivamente E tal como na modelagem com UML importante estabelecer se rela es de sinon mia nesse processo que tamb m pode ser entendida como de co hipon mia palavras descendentes num tesauro ou classes de conceitos hierarquizadas sob uma mesma superclasse tendo como resultado uma simplifica o do modelo Cimiano 2006 p 24 argumenta que os sin nimos neste caso correspondem aos synsets da WordNet Como observado anteriormente os conceitos s o definidos formalmente como uma tupla i c c Refe c gt onde i c a intens o do conceito c a extens o desse conceito e Refc descreve a realiza o l xica desse conceito num corpus Deste
331. os tomadores de decis es nas organiza es Com este recurso metodol gico baseado na psicologia os engenheiros do conhecimento poder o desencadear processos mentais estruturados de cria o de significado e constru o de conhecimento para Intelig ncia Competitiva WEICK 1995 CHOO 2003 1 5 Justificativa V rios fatores se apresentam como justificativas para o desenvolvimento de uma tese de doutorado alguns de natureza motivacional essencialmente acad mica outros de natureza mais personal stica com base no estoque de conhecimento e no sistema de cren as do estudante pesquisador O caso presente n o constitui exce o e por isso apresenta se a seguir algo sobre esses fatores essenciais unindo aspectos motivacionais e de oportunidade 1 5 1 Motiva o O desenvolvimento desta tese teve como motiva o acad mica dois aspectos centrais o primeiro numa perspectiva hist rica da pr pria Ci ncia da Informa o com base nas grandes quest es enunciadas por Bates 1999 o segundo numa dimens o contempor nea com o 8 Sintagma KOCH e SILVA 1985 apud SANTOS 2005 consiste num conjunto de elementos que constituem uma unidade significativa dentro da ora o e que mant m entre si rela es de depend ncia e de ordem Organizam se em torno de um elemento fundamental denominado n cleo que pode por si s constituir o sintagma Os sintagmas nominais s o sintagmas cujo n cleo um nome ou substantivo e Peri
332. outros interessados rg os fiscais e de controle estatal auditores independentes observadores externos etc Com base em seus objetivos a presente pesquisa se concentra na disponibiliza o de informa es corporativas para o aprendizado dos gestores da informa o e do conhecimento e gestores do neg cio em reas de intelig ncia competitiva nas organiza es complexas 5 2 3 Web portais corporativos A defini o conceitual de um novo objeto identificado no mundo digital da WWW nem sempre tarefa trivial e alguns autores utilizam para tanto met foras tais como no caso de Web Portal Corporativo A ampla difus o da Internet e de todos os tipos correlatos de e tecnologias e recursos de informa o deu origem ao conceito de portal ou de modo mais ampliado de esta o do ciberespa o Inicialmente esse conceito era estruturado em torno das possibilidades de busca e dissemina o da informa o apresentadas pela World Wide Web Ent o o termo portal significava um ponto de entrada ou s tio Web origin rio para combina o da fus o de conte dos e servi os de dissemina o da informa o assim como para prover uma base dom stica personalizada para seus usu rios a partir da qual eles estariam aptos a lan ar expedi es de explora o no ciberespa o um portal de e business um mecanismo ou um dispositivo f sico que prov acesso a um conjunto din mico de servi os do neg cio ao mes
333. over no evento O pragmatismo proposto no modelo de engenharia do conhecimento desenvolvido nesta tese encontra suporte filos fico tamb m em Kant apud Bateson 2002 argumentando sobre o que relevante quando uma mente se depara com uma diferen a que faz diferen a Bateson 2002 p 92 sugere como exemplo a reflex o sobre um ponto marcado com giz sobre um quadro negro perguntando se onde estaria a diferen a entre o ponto e o quadro Kant argumentou h muito tempo que essa peca de giz cont m um milh o de fatos potenciais Tatsachen mas que somente muito poucos deles se tornam verdadeiramente fatos ao afetarem o comportamento de entidades capazes de responder a fatos Eu substituiria os Tatsachen de Kant por diferen as e esclareceria que o n mero de potenciais diferen as nesse giz infinito mas que muito poucos deles se tornam diferen as efetivas isto itens de informa o no processo mental de qualquer entidade maior Ou seja as diferen as relevantes est o vinculadas a contextos ou s o diferen as em contextos onde os seres humanos podem perceber o que lhes familiar e o que n o concentrando sua aten o e estudos mais aprofundados sobre o que uma diferen a que faz diferen a em termos mais comuns uma novidade que desperte interesse 3 5 2 3 Abordagem psicol gica de Weick e Choo Weick 1995 declara que a cria o de significado sensemaking mais um conjunto de ideias em desenvolvimento
334. p tulo busca definir os contornos epistemol gicos hist ricos do problema e oportunidades de inser es tem ticas em linhas de pesquisa voltadas para a Gest o da Informa o e do Conhecimento na Ci ncia da Informa o 3 2 Contextos e conceitos 3 2 1 Intelig ncia competitiva nas organiza es Tarapanoff 2006a explica que na tradi o francesa numa vis o assumidamente sist mica a intelig ncia competitiva desenvolvida a partir da veille technologique entendida de forma mais ampla incluindo a busca de qualquer informa o na ambi ncia de car ter cient fico tecnol gico social ou pol tico sobre os seus competidores e tamb m clientes fornecedores e parceiros que possibilite melhor posicionamento da organiza o na ambi ncia Est ligada ao planejamento estrat gico da organiza o ao seu posicionamento na ambi ncia e estrat gia TARAPANOFF 20063 Conforme o pensamento de Liebowitz 2006 considera se tamb m que Gest o da Informa o e do Conhecimento s o construtos epistemol gicos multidisciplinares capazes de suportar metodologicamente o desenvolvimento de intelig ncia competitiva em organiza es complexas Nonaka e Takeuchi 1997 colocam esse desafio metodol gico estruturante da seguinte forma 2 Em geral entendendo se organiza es complexas como grandes organiza es privadas e p blicas 8 Veille Technologique vig lia ou monitoramento do ambiente tecnol gico t
335. padr o tipicamente industrial voltado para a automa o de processos produtivos tornaram se tamb m um s rio obst culo s mudan as evolutivas ou s vezes revolucion rias nessas mesmas organiza es na medida em que sistemas e estruturas de neg cio se confundem numa rela o simbi tica de forte acoplamento Em algumas organiza es observa se que sistemas e processos de neg cio se confundem com o pr prio neg cio criado pela organiza o como no caso de empresas mais inovadoras baseadas na World Wide Web WWW Com tal cen rio mudangas reestruturantes nos processos operacionais para melhoria da competitividade exigem mudangas nos sistemas organizacionais na mesma velocidade tornando a re modelagem desses sistemas um problema de solu o n o trivial em projetos de mudan a CAPUANO 2007 HAMMER e CHAMPY 2001 HEHN 1999 DAVENPORT 1993 Em suma organiza es mais competitivas provavelmente ser o no futuro as mais flex veis em suas estruturas e sistemas reunindo as condi es necess rias para readapta o s cont nuas mudan as nos ambientes de neg cio na velocidade e profundidade necess rias Os sistemas de informa o computacionais SICs corporativos t m sido desenvolvidos a partir dos anos 1960 ao longo de anos sen o d cadas de investimentos nas organiza es complexas com base em modelos de neg cio bastante est veis E algumas organiza es como bancos por exemplo ainda utilizam rotinas d
336. para modelagem do neg cio e seus sistemas Axiomas Gerais Esquema de Axiomas Hierarquia de Rela es Rela es Hierarquia de Conceitos HO eeneeltos Figura 3 13 Camadas de Aprendizado Ontol gico Fonte CIMIANO 2006 O conceito de Arquitetura Orientada a Servi o neste contexto subsume o conceito de servi o como um modelo padronizado de entrega de algo de valor que no caso do software corporativo poder assumir uma variedade de situa es O conceito de servi o se refere fun o de um componente da arquitetura de software corporativo podendo significar uma simples rotina de verifica o computacional da validade de um n mero de Cadastro de Pessoa F sica CPF de um cliente at uma aplica o maior e mais complexa como uma folha de pagamentos com milhares de benefici rios Com a ACF pode se elicitar servi os processos e classes de objetos e atributos de software al m de rela es entre classes e instancia o defini o de objetos de processamento Outra utilidade da ACF nesse cen rio atende necessidade de demarca o dos limites ontol gicos dos componentes de softwares legados para fins de refatora o encapsulamento e reaproveitamento reutiliza o numa AOS As principais vantagens do m todo s o i automa o 67 do processo de modelagem de sistemas de informa es computacionais SICs nas cl ssicas fases de elabora o e an lise dos m todos orientados a obje
337. perations manager for IBM Life Sciences where he was responsible for day to day operations and strategy for one of IBM s fastest growing new businesses Joe began his work in Healthcare and Life Sciences in 2000 when as Senior Manager of the IBM Research Computational Center he oversaw research efforts in nanotechnology materials chemistry and chemical kinetics His academic credentials include a Ph D from Stanford University and undergraduate degrees in mathematics and chemistry from Dartmouth College Following post doctoral work at the University of California Berkeley Joe joined the Watson Research Center as a research staff member in 1982 Healthcare is one of the fastest growing IT opportunities in the developed and developing world says Joe The opportunity to transform the way biomedical research is done and the way healthcare is delivered around the world is pretty energizing What gets me out of bed in the morning is literally the chance to change the world for the better by helping people discover new treatments for disease and helping people get access to safe affordable and effective medical care Essa p gina tamb m apresenta conectores na Web para outros conte dos textuais correlatos onde a organiza o apresenta seus casos de sucesso nessa linha de neg cios Com uma simples pesquisa recursiva a partir de um conceito minerado anteriormente pode se portanto obter informa o de qualidade para aprofundamento de temas em
338. pior caso estudado quando se utiliza os 10 de substantivos nomes mais frequentes nas colet neas amostradas cai para 81 796 ainda um percentual de revoca o de substantivos nomes bastante interessante para os fins propostos mais de quatro objetos recuperados a cada cinco existentes O Gr fico 5 3 baseado nos dados do APENSO Il mostra os resultados do experimento em termos de conex o sintagm tica para todos os textos da amostra e os substantivos mais frequentes nas escalas discretas adotadas Percentagem de Conex o Sintagm tica dos Substantivos mais Frequentes Total da Amostra WalMart Sun Microsystems Royal Dutch Schell Microsoft Research IBM Research Hyundai Corporation HSBC L 100 096 Heineken 10 0 GreenLif e Grocery 7 5 Fujitsu Research Institute E 5 0 Canon E 2 595 Bernstein Law Firm Bayer GmbH Bank of America o 8 O G N c G Oo o 2 x o Lr Amazon com 0 0 20 0 40 0 60 0 80 0100 0120 0 Conex o Sintagm tica 96 Gr fico 5 3 Percentuais de Conex o Sintagm tica de Substantivos A conclus o geral conforme as curvas do Gr fico 5 4 que quanto mais freq entes os nomes substantivos considerados melhor o desempenho da revoca o desses nomes substantivos com o uso de sintagmas plurinominais na minera o conceitual de textos ou melhor o percentual de conex o sintagm tica dos nomes substantivos Ou ainda numa linguagem mais adequada ao objeto desta
339. poraneamente por neurocientistas assumem que mente e corpo s o da mesma natureza f sica e podem ser explicadas como partes de um todo complexo 79 sua obra seminal Os crit rios para se classificar algo como uma mente para Bateson 2002 pp 85 86 devem ser os seguintes 1 Uma mente um agregado de partes ou componentes que interagem entre si 2 A intera o entre partes de uma mente disparada por diferen a e a diferen a um fen meno n o substancial e n o localizado no tempo ou espa o diferen a relativa a negentropia e entropia mais que a energia Processo mental requer energia colateral Processo mental requer cadeias circulares ou mais complexas de determina o Em processos mentais os efeitos de diferen a devem ser vistos como transforma es isto vers es codificadas de eventos que os precederam As regras de tais transforma es devem ser comparativamente est veis isto mais est veis que os conte dos mas elas pr prias s o sujeitas a transforma es 6 A descri o e classifica o desses processos de transforma o revelam uma hierarquia de tipos l gicos imanentes no fen meno AAR A mente para Bateson 2002 p 90 provida de um sistema sensorial que para ele talvez exista tamb m em outras criaturas e plantas que pode operar somente com eventos que podemos chamar de mudan as A n o mudan a impercept vel a n o ser que estejamos desejando nos m
340. pos de objetos podem ser definidos pelo usu rio e se postarem dispon veis como marcadores de texto e Ordena o de conceitos Ordena o de conceitos uma t cnica til quando se deseja descobrir diferentes formas como um especialista v os relacionamentos entre um conjunto fixo de conceitos Na vers o mais simples apresentado a um especialista um n mero de cart es escrito em cada um uma palavra conceitual Os cart es s o embaralhados e solicitado ao especialista ordenar os cart es ou em um n mero fixo de pilhas ou em algum n mero de pilhas que o especialista considere apropriado O processo repetido muitas vezes Utilizando esta t cnica tenta se obter m ltiplas vis es da organiza o estrutural do conhecimento mediante solicita o ao especialista para executar a mesma tarefa v rias vezes Cada vez que o especialista ordena os cart es ele deve criar ao menos uma pilha que difere de algum modo das ordena es anteriores O especialista deve tamb m providenciar um nome ou r tulo de categoria para cada pilha de ordena o Variantes da ordena o simples s o diferentes formas de ordena o hier rquica Em uma dessas vers es solicita se ao especialista produzir em primeiro lugar duas pilhas de cart es na segunda sess o de ordena o tr s ent o quatro e assim por diante Finalmente solicita se ao especialista informar se existem duas pilhas com algo em comum Caso existirem tem se isolado um c
341. pria macroestrutura operativa dessa organiza o O macro conceito seguinte denominado Processos Produtivos se refere a processos produtivos atores insumos e produtos mas sem refer ncia a qualquer organiza o nem mesmo a organiza o que realiza a an lise de intelig ncia Considera se neste exerc cio que os conceitos com tais atributos tarefa agente insumo amp produto s o utilizados nos Web Portais referindo se ao nicho competitivo onde se encontra a pr pria organiza o que patrocinou a minera o de conceitos assim como seus atuais concorrentes sendo todas portanto players nesse mercado Exemplos extra dos dos contextos estudados s o after sales service management asset monitoring and management data exploration expertise in reasoning techniques information systems logistics engineering model solutions for management production systems risk assessment shopping assistant technology steps toward implementation system management warning system for automobiles e outros O bloco de macro conceito seguinte denominado Concorrentes classifica os conceitos e objetos que se referem a organiza es e pessoas externas pr pria organiza o patrocinadora que de algum modo podem ser ou se tornar substitutas das atuais concorrentes novas concorrentes ou entrantes clientes e ou parceiras A incid ncia de atributos correlatos a ambiente externo que determina essa classifica o
342. que se refere a esse conceito com uso de s mbolos ling sticos O objetivo da engenharia reversa seria redescobrir esse conceito indiretamente sem acesso ao autor do texto realizando o processo inverso partindo dos s mbolos para os objetos e seus conceitos O processo de aprendizado das extens es dos conceitos e das rela es resultantes conhecido como popula o de ontologias suportado por uma cole o de m todos desenvolvidos ou resgatados nos ltimos anos Cimiano 2006 apresenta alguns experimentos com o m todo An lise de Conceito Formal na indu o de rvores de conceitos a partir de textos demonstrando que poss vel separar se os termos extra dos dos textos em camadas ontol gicas de signific ncia Figura 3 13 O modelo de bolo para o aprendizado ontol gico dessa figura apresenta as fases desse tipo de atividade a partir da an lise de textos em linguagem natural A primeira fase se refere aquisi o de termos relevantes no texto passando se depois para a identifica o de sin nimos ou variantes ling sticas de termos avan ando se depois para a forma o de conceitos e sua hierarquiza o arb rea aprendizado das rela es entre os conceitos extra dos do texto com informa es do pr prio texto ou textos auxiliares hierarquiza o dessas rela es instancia o de axiomas e finalmente a defini o arbitr ria de axiomas teis para o aprendizado de ontologias do dom nio Conceito
343. r pria modelagem de arquitetura de sistemas de informa o computacionais muito poderia se beneficiar desse tipo de pesquisa considerando se o custo principalmente em termos de tempo da modelagem de sistemas corporativos atualmente Esta rea parece particularmente promissora para os pr ximos anos quando a Gera o Y ou gera o pds nternef estiver no comando das organiza es em geral e o conceito de leitura mosaica se tornar um imperativo metodol gico para supera o dos problemas da gest o da informa o da era Gutenberg Cunha a prop sito na entrevista apresentada em Maia 2010 conclui que O jovem de hoje est lendo diferente Com essa nova era digital n s temos um leitor imersivo aquele que navega em outra materialidade que a da tela do computador Assim o jovem est lendo mas essa leitura de outra forma Uma leitura mosaica E essa leitura n o cont nua come ou com o jornal ele que preparou o nosso olhar para a Internet O problema que a gente professores continua tentando trabalhar o nosso leitor como se ele fosse o leitor renascentista que tinha 8 Considerando se o contexto pr nternet da cr tica de Werner 1988 ela pode ser aplicada pr pria Web na atualidade devido tediosa recursividade de busca com hipertexto 201 todo o tempo de decifrar a escrita Esse leitor contemplativo desapareceu j na Revolu o Industrial No lugar dele veio um lei
344. r sobre as causas dessas les es t o similares mas com explica es insatisfat rias apresentadas pelos pais 81 bastante discutido na neuroci ncia em contextos de Intelig ncia Artificial o conceito de disparo de comportamentos em determinadas situa es Eles argumentam que uma condi o necess ria para a emo o o est mulo ou descarga no sistema nervoso aut nomo E o est mulo disparado por interrup es da atividade em curso O est mulo tem um significado fisiol gico porque ele prepara as pessoas para rea es lute ou corra A percep o de est mulo dispara um ato rudimentar de cria o de significado Ela providencia um aviso que h algum est mulo para o qual deve se prestar aten o a fim de iniciar uma a o apropriada Esse sinal sugere que o bem estar de algu m pode estar em risco Outra situa o prop cia para cria o de significado ocorre quando se foca num detalhe marcante de um todo e esse detalhe sugere implica es importantes para esse todo Weick 1995 p 49 cita neste ponto outro autor James 1890 1950 vol 2 p 340 343 aponta para a import ncia dos sinais extra dos para cria o de conhecimento em sua discuss o acerca dos dois grandes pontos de racioc nio Os pontos s o primeiro um caracter sinal extra do considerado como equivalente ao inteiro dado do qual ele provem O segundo ponto de racioc nio que o caracter extra do assim conside
345. ra nas quatro ltimas linhas a soma total das quantidades de cada coluna as m dias os desvios padr es e as rela es entre os desvios padr es e as m dias Os procedimentos para obten o dos dados e c lculos dos par metros estat sticos de Processamento da Linguagem Natural PLN das colet neas do APENSO s o apresentados e discutidos metodologicamente a seguir 5 5 An lise sint tica e minera o de textos 5 5 1 Metodologia de recupera o da informa o O processo de coleta organiza o armazenamento processamento e an lise dos dados textos em linguagem natural do m todo adotado na experi ncia de laborat rio da pesquisa apresentado na Figura 5 6 As atividades expressas nos ret ngulos de cor mais clara s o autom ticas com uso de softwares enquanto as atividades dos ret ngulos de cor mais escura s o apenas semi autom ticas envolvendo penosas e morosas atividades manuais com suporte de um editor de textos 114 Experimentos de Laborat rio Parte PLN e Minera o de Textos An lise de Substantivos e Sintagmas An lise de Palavras Figura 5 6 Processo Experimental Parte Fonte do autor da tese O processo se inicia ap s a sele o da organiza o e seu respectivo Web Portal Corporativo como fonte de informa o tendo como primeira atividade a pr pria busca dos conte dos das p ginas com uso dos recursos de um Web Portal de busca como o Google O passo seg
346. ra conceitua es pragm ticas E assim Hessen 1976 p 50 51 apresenta a defini o de verdade a seguir grifos nossos Como o cepticismo tamb m o pragmatismo abandona o conceito da verdade no sentido da concord ncia entre o pensamento e o ser Por m o pragmatismo n o se det m nesta nega o mas substitui o conceito abandonado por um novo conceito de verdade Segundo ele verdadeiro significa til valioso fomentador da vida O intelecto dado ao homem n o para investigar e conhecer a verdade mas sim para poder orientar se na realidade O conhecimento verdadeiro portanto estaria na concord ncia do conte do do pensamento com o objeto numa vis o utilitarista que agregue valor exist ncia humana Esta uma defini o suficiente que ser desenvolvida mais adiante no item 3 5 de um ponto de vista cognitivo com exemplifica es emp ricas experimentais no Cap tulo 6 3 3 1 Modelos e conhecimento Schreiber Wielinga e Breuker 1993 s o autores historicamente vinculados ao desenvolvimento de uma conhecida metodologia para modelagem de sistemas baseados no conhecimento Knowledge Based Systems acr nimo KBS denominada Knowledge Acquisiton and Documentation Structuring ou KADS atualmente atualizada no framework de gest o e engenharia do conhecimento denominado CommonKADS Essa metodologia foi desenvolvida na Universidade de Amsterd constituindo o padr o europeu para o desenho de KBS fundamentan
347. rado sugere uma determinada conseq ncia mais obviamente que a sugerida pelo dado total originalmente O sinal extra do real ou uma implica o distinta que era invis vel no objeto indiferenciado O exemplo nesse caso o da pessoa que no processo de avalia o de uma pe a de roupa para compr la argumenta com base no conhecimento da tintura usada nessa roupa que a roupa poder desbotar Essa pe a de roupa objeto indiferenciado considerada no todo n o apresenta a informa o sobre a tintura problem tica mas a experi ncia do comprador com essa tintura sinal extra do em outra roupa permite um racioc nio com implica es para toda a pe a o prov vel desbotamento da tintura dessa pe a de roupa O contexto portanto determinante para o processo de extra o de sinais primeiro porque o contexto afeta o que extra do como um sinal e segundo porque o contexto tamb m afeta o modo como o sinal extra do interpretado importante tamb m o modo como os eventos s o apresentados no contexto se os eventos s o noticiados as pessoas elaboram sentidos para os mesmos e se eventos n o s o noticiados eles n o s o dispon veis para a cria o de significado WEICK 1995 p 51 Essas observa es emp ricas de base psicol gica representam uma fundamenta o metodol gica para minera o de conceitos com base no repert rio tradicional da disciplina Recupera o da Informa o na Ci ncia da
348. radu o aproximada 24 A ess ncia do problema da organiza o transformar os agentes que buscam estrategicamente metas mutuamente conflitantes em um sistema cooperativo racional E devido nossa capacidade limitada de processar as informa es o conhecimento essencial para a garantia da racionalidade cooperativa Barnard reconheceu a import ncia da integra o dos processos l gicos e n o l gicos da atividade mental humana do conhecimento cient fico e comportamental e das fun es gerenciais NONAKA TAKEUCHI 1997 p 43 Outros pesquisadores citados por Nonaka e Takeuchi 1997 como March e Simon 1993 tamb m colocam o problema da complexidade e das limita es cognitivas dos seres humanos nas organiza es como um desafio te rico na formula o de modelos de administra o Choo 1991 por exemplo apresenta uma exaustiva revis o de literatura sobre teoria das organiza es resgatando Cohen March e Olsen 1972 que criticam as id ias de March e Simon 1993 e apresentam o modelo da lata de lixo e a teoria da inteligibilidade para explicar a complexidade das organiza es Eles tamb m argumentam que a realidade uma realiza o cont nua que surge dos esfor os de criar a ordem e tentar entender o que ocorre nas organiza es Em termos concretos as conex es entre os fen menos sociot cnicos que constituem as condi es de contorno da ambi ncia organizacional podem apres
349. rafas Garrafas vazias parar produ o Empacotar E Garrafas Figura 3 11 Modelo de Atividade na UML Fonte WEILKIENS e OESTEREICH 2007 O exemplo da Figura 3 11 de Weilkiens e Oestereich 2007 mostra uma atividade industrial de produ o de pacotes de seis garrafas sa das de uma determinada bebida a partir de garrafas vazias entradas Conforme o modelo garrafas vazias passam por uma a o inicial de enchimento Encher Garrafas quando ent o se decide se a produ o continua no per odo ou se parada para intervalo que pode ser ao final do turno de um dia de produ o caso o processo n o seja interrompido as garrafas cheias s o ent o rotuladas a o Rotular Garrafas e finalmente empacotadas em pacotes de seis unidades a o Empacotar Garrafas quando a atividade conclu da com a apresenta o das sa das novos pacotes de seis unidades Gon alves 2000 argumenta que uma organiza o uma cole o de processos um conceito que se encontra na ess ncia da epistemologia da arquitetura de sistemas organizacionais s vezes mencionados simplesmente como fluxos e comportamentos ou regras Portanto qualquer avan o tecnol gico no sentido da automa o do desenho de processos organizacionais a partir de informa es dispon veis como entradas pode ser 64 considerado til em contextos competitivos pois a velocidade com que as organiza es se adapt
350. rar tamb m com a n o ocorr ncia de algo que era esperado Quando algo previsto n o acontece o ser humano se encontra diante de algo diferente do padr o em seu modelo mental que impacta a cria o de significado na medida em que exige uma explica o Weick 1995 p 45 46 se refere a prop sito interrup o de fluxos embora as pessoas estejam imersas em fluxos elas raramente s o indiferentes ao que passa por elas Isto particularmente verdade no caso de interrup o de projetos A realidade dos fluxos se torna mais aparente quando o fluxo interrompido Uma interrup o de um fluxo tipicamente induz uma resposta emocional que ent o pavimenta o caminho para a emo o influenciar a cria o de conhecimento Interrup o um sinal que mudan as importantes t m ocorrido no ambiente Assim um evento chave para a emo o a interrup o de uma expectativa E faz um bom sentido evolucion rio construir se um organismo que reage significativamente quando o mundo n o mais do jeito que era Weick 1995 p 45 citando Berscheid e Mandler explicam um fen meno emocional BCS Battered Child Syndrome S ndrome da Crian a Espancada Weick 1995 reporta o conhecido processo de cria o de significado a partir da observa o cont nua de certos padr es de les es corporais em crian as que levaram um m dico nos EUA na d cada de 1950 interagindo com t cnicos de radiologia a estudar e teoriza
351. ratively to track and investigate warranty problems and take corrective action A portal will provide dashboard views and functionality failure notification service reminders for customers and support for collaborative decision making to track and investigate warranty problems While telematics provides critical functionality for the Early Warning System one of the more important capabilities is the ability to correlate information across multiple sources and use analytical tools to provide useful information for decision making and action IBM Research s strengths in these areas combined with an understanding of automotive technology and the industry result in a solution that has the potential to help manage rising warranty costs contribute to consumer safety and eventually help develop a better brand Next steps A prototype Early Warning System has been built and has monitored 25 parameters on 100 vehicles for three months The next steps are to integrate additional sources of data and build the collaborative and decision making support that will make these solutions most valuable for the auto industry Essa simples busca resultou portanto nas seguintes informa es relevantes no contexto que podem ser teis para desencadear um processo de construc o do conhecimento para Intelig ncia Competitiva a a organiza o IBM Research vislumbra um mercado nascente The Challenge para c um produto inovador sis
352. rd years NNS year ago RB ago Figura 5 8 Exemplo de Resultado da Etiquetagem Fonte do autor da tese importante observar se na coluna I do APENSO o percentual de substantivos que integram sintagmas plurinominais em cada texto analisado que denominamos de ndice de Representa o Substantiva em Sintagmas Plurinominais IRSP com valor experimental m dio de 63 5 nesta pesquisa para listas completas com todos os substantivos dos textos O n vel de 117 efici ncia do m todo na recupera o de conceitos representados nesta etapa pelos substantivos e nomes pr prios com base nesse indicador aumenta sensivelmente quando se utiliza apenas os substantivos e nomes mais freq entes num texto aspecto param trico estat stico fundamental que ser discutido a seguir Esse indicador importante porque mostra o n vel de efici ncia do m todo de recuperac o da informa o proposto e testado em laborat rio podendo ser comparado ao ndice de revoca o da recupera o da informa o tradicional com uso de palavras chave 5 5 2 An lise estat stica importante ressaltar se neste ponto que a an lise estat stica apresentada n o deve ser encarada como uma an lise similar de um corpus ling stico quando se pretende conhecer padr es de uso da linguagem natural em estudo O que se pretende nesta an lise estat stica de sintagmas conceituais dos textos corporativos publicados na Web conhec
353. re humanos no mundo real Obviamente o evento mais prov vel o de um texto estruturado e leg vel para os humanos e portanto ser este o conjunto de sinais com menor quantidade de auto informa o e desse modo menos relevante Outro exemplo evidente o de eventos compostos Quais seriam os valores da auto informa o numa sequ ncia de tr s lan amentos de uma mesma moeda do resultado combinado tr s caras ou tr s coroas E de duas caras e uma coroa ou vice versa Em qual situa o se teria um valor mais alto de auto informa o e portanto de surpresa O c lculo nesse caso seria M evento de tr s lan amentos de uma moeda P M probabilidade de ocorr ncia de cara cara cara ou coroa coroa coroa HHH vro E i M valor da auto informa o de M b universo de resultados combinados poss veis Onde b poder ser cara cara cara cara cara coroa cara coroa cara coroa cara cara coroa coroa cara coroa cara coroa cara coroa coroa coroa coroa coroa Logo b 8 combina es poss veis Considere se ainda M como o resultado cara cara cara H de head M como o H resultado coroa coroa coroa T de tail e My como outro resultado qualquer Como se tem P M P M P M 1 8 ent o P M so 2x1 8 1 4 e P M rii rasan arr 6x1 8 3 4 Finalmente tem se os seguintes valores de auto informag o i M P M 1 4 0 667 HHH amp
354. recional baseado em est gios Il A evolu o da Web um processo de progressiva clonagem comportamental da sociedade humana 102 Davis 2008 apresenta uma vers o dessa evolu o de um ponto de vista sem ntico da informa o argumentando que A onda sem ntica abrange quatro est gios do crescimento da Internet O primeiro est gio Web 1 0 se referia conex o de informa o e disponibiliza o na rede Web 2 0 trata da conex o de pessoas colocando o eu em interface de usu rio e o n s em redes de participa o social O pr ximo est gio Web 3 0 est iniciando agora E sobre representa o de significados conex o de conhecimento e utiliza o disso tudo de modo a tornar nossa experi ncia de Internet mais relevante til e prazerosa A Web 4 0 vir mais tarde E ser sobre a conex o de intelig ncias numa Web onipresente onde tanto as pessoas como as coisas raciocinam e se comunicam em conjunto Os estudos prospectivos da Web 2 0 e al m indicam portanto uma tend ncia de aumento cont nuo tanto do volume de informa es abertas dispon veis na rede como da diversidade de formas utilizadas para sua representa o A caracter stica marcante desse est gio em termos de funcionalidade a presen a de ambientes de colabora o onde os usu rios promovem intera o entre si de modo N para N em modelos para troca de experi ncias e aprendizado coletivo A Figura 5 3 apresenta um mode
355. recorrente ainda que sem solu es gen ricas inserindo se no atual cen rio corporativo de abund ncia de informa es e pouco xito dos projetos de sistemas de informa o Sls baseados em computador em ambientes competitivos AL NEIMAT 2007 SIMPSON et al 1996 Este paradoxo se amplia na medida em que quanto mais informa es acumulam as organiza es mais complexos se tornam seus ecossistemas informacionais e necessariamente seus sistemas de informa o computacionais SICs Os problemas conceituais inerentes rea de estudos conhecida como Recupera o da Informa o RI a partir de fontes n o estruturadas tais como textos em linguagem natural ou textos livres e grava es de udio e v deo constituem desafios formid veis que t m motivado esfor os da comunidade da Ci ncia da Informa o desde os seus prim rdios nos anos 1950 ap s a publica o do hist rico artigo de Vanevar Bush lan ando a id ia do MEMEX BUSH 1945 considerada uma das precursoras do hipertexto A quantidade de autores e obras acad micas produzidas desde ent o vasta como se pode observar nas publica es patrocinadas pela 17 O conceito de informa o adotado nesta tese discutido em profundidade no Cap tulo 3 item 3 5 mas provisoriamente pode se utilizar o conceito filoficamente ing nuo de Drucker apud Davenport 2000 p 19 informa o um dado dotado de relev ncia e prop sito Entretanto reconhecendo tamb m a
356. reens o confian a e valiosos conselhos ao longo do trabalho de orienta o acad mica que Parsons apud Roberts 1973 p 8 escreveu Ben dell Intelletto no Inferno de Dante significa Bem do Intelecto Que poderia ser interpretado numa vers o contempor nea como Capital Intelectual tornou poss vel a elabora o deste trabalho E como n o poderia esquecer nesta oportunidade agrade o lhe tamb m pela sua amizade pelas interessantes conversas abertas sobre temas de conhecimento geral e pelo precioso bom humor que o fazem uma pessoa mpar Com sua presen a de esp rito marcante nosso conv vio tornou se muito agrad vel e produtivo e um trabalho que j me era prazeroso por natureza tornou se quase l dico Agrade o novamente ao Prof Dr Cl udio Chauke Nehme meu orientador de empreitada acad mica anterior e sempre grande incentivador por me acompanhar em mais este desafio como co orientador prestimoso conselheiro e c mplice do meu entusiasmo pelos temas da tese O seu amplo conhecimento sobre temas acad micos de meu especial interesse como Intelig ncia Artificial e Gest o da Informa o e do Conhecimento tornaram o desenvolvimento do trabalho bastante estimulante Agrade o Prof Dra Kira Maria Antonia Tarapanoff pelas preciosas cr ticas construtivas apresenta o dos resultados da tese agregando inestim vel contribui o aos aspectos cognitivos da cria o de significado e constru o do
357. rem similares s o ent o selecionados e transformados por um mecanismo de montagem l gica em gr ficos conceituais O conceito de montagem dos Gr ficos Conceituais Essas cr ticas basicamente contrap em a necessidade do uso da Teoria de Conjuntos e da lgebra para o desenvolvimento de aplica es computacionais e de estrat gicas de pesquisa em Intelig ncia Artificial ao realismo filos fico com sua dimens o especulativa de Peirce 52 fundamental do ponto de vista cient fico na medida em que implementa os tr s princ pios elementares da Intelig ncia Artificial baseada na natureza FREEDMAN 1995 A melhor maneira de se compreender como funciona a intelig ncia humana estudar antes como funciona um modelo de intelig ncia mais elementar como a intelig ncia animal I A intelig ncia pode ser emergente uma propriedade da intera o complexa de elementos mais simples lll A intelig ncia demasiado complexa para que possa ser projetada a partir do zero Entendendo a Intelig ncia Artificial IA como uma rea de estudos de representa o do conhecimento e seu uso na linguagem racioc nio aprendizado e solu o de problemas SOWA 1984 algo como uma disciplina de engenharia do conhecimento tornando operacionais construtos te ricos que imitam a capacidade de aprendizado e racioc nio humanos a montagem de um Gr fico Conceitual GC parte de elementos mais simples os percepts para chegar a
358. resolver O autor sugere considerar se a compreens o da linguagem natural como uma engenharia e n o como uma atividade cient fica de base Com a IA Wilks 1975 p 131 vislumbrara um casamento multidisciplinar promissor para a rea de PLN Dado um contexto e explica o suficientes qualquer coisa pode ser acomodada e compreendida essa compet ncia b sica da linguagem humana que os linguistas gerativos t m sistematicamente ignorado e que uma vis o de IA da linguagem poderia se habilitar a tratar 30 O traco marcante dessa vis o de Wilks a crenca numa compreens o epistemol gica e tecnol gica da linguagem natural sem as limita es inerentes a teorias cient ficas aprior sticas sonhadas pela corrente racionalista da lingu stica adotando uma abordagem experimentalista e empirista Concentra seu ataque nos formalismos ou no que ele chama fal cia da regra 100968 que n o admite exce es s regras e formalismos dos modelos desenvolvidos para o tratamento cient fico da linguagem natural WILKS 1975 p 132 Ou seja ele defende uma abordagem multidisciplinar de PLN com IA til em determinados contextos onde n o se exige modelos explicativos amplamente generaliz veis do ponto de vista de uma Ci ncia da Linguagem mas til para a solu o de determinados problemas do mundo real Borko 1981 pesquisador seminal da Ci ncia da Informa o pr Internet defendera id ias pragm ticas como as de Wilks em construtos
359. rio m todo cient fico com as vantagens de representa o simplificada de uma realidade complexa e o estabelecimento de conex es ou rela es entre os conceitos ou ideias modelados Algumas das abordagens de modelagem apresentadas a seguir s o as mais comuns no desenho de sistemas de informa o baseados em computador e outras s o adequadas aos construtos de representa o da informa o conceitual nesta tese comum a busca de defini es para conceitos que por sua vez servir o de base para o desenvolvimento de novos conceitos construindo se tramas de conceitos que delimitam a Ci ncia Contudo alguns temas apresentam dificuldade como Gest o do Conhecimento O que o conhecimento afinal Conhecimento tal como dado e informa o um conceito que apresenta muita dificuldade para defini es precisas e Hessen 1976 p 87 discorrendo filosoficamente sobre a ess ncia do conhecimento define conhecimento como uma rela o entre um sujeito e um objeto no caso o sujeito quem tenta ter acesso ao conhecimento sobre um objeto Esse autor alerta que o problema do conhecimento consiste na complexidade dessa rela o entre o sujeito e o objeto quando se busca a concord ncia verdadeira do conte do do pensamento com o objeto O dilema da filosofia quanto ao problema do conhecimento se reporta s duas possibilidades de caminhos epistemol gicos fundamentais para se definir o conhecimento ou se admite que todos os
360. rios no plural 115 Deve se tamb m estipular previamente o que se denomina horizonte de busca no software analisador sint tico que s o os n meros de palavras frente e atr s do padr o sint tico utilizado presentes nos segmentos de texto processando se ent o uma consulta para cada tipo padr o de substantivo ou nome obtendo se um relat rio de sa da para cada horizonte Como exemplo numa das sess es de minera o de texto utilizou se o par de padr es sint ticos NN e NNS com objetivo de extra o de segmentos de textos com 100 letras incluindo se os espa os em branco estipulando se a captura de todos os tokens com etiquetas NNS encontrados at 10 tokens frente ou atr s do token NN As sa das do WordSmith Figura 5 7 se apresentam como relat rios em formato pr prio desse software e precisam por isso ser exportadas para planilha eletr nica ou outro formato mais adequado para processamento de listas textuais A quantidade de substantivos com repeti o para preenchimento da coluna E do APENSO obtida mediante a observa o nos relat rios de sa da do WordSmith e soma das quantidades de substantivos comuns no singular com etiqueta NN e plural com etiqueta NNS e nomes pr prios NP e NPS Entretanto as listas de sa da do analisador sint tico cont m um volume expressivo de ru dos necessitando de uma limpeza antes da an lise de conte dos Os ru dos s
361. rma es que o comp em ter maior 159 poder de atra o da aten o do analista desencadeando assim um processo psicol gico de criac o de significado Em termos de Intelig ncia Competitiva resta saber da utilidade desse modelo conceitual para conduzir o racioc nio dos engenheiros do conhecimento Como recurso para aprofundamento da an lise sugere se ent o uma pesquisa espec fica recursiva no Google utilizando se a express o chave Fujitsu Research and service delivery referindo se o primeiro termo ao contexto organizacional e o segundo ao alvo da pesquisa unidos pelo conector l gico AND O resultado da busca aparece com v rios endere os URL Uniform Resource Locator poss veis sendo o primeiro no ranking um endere o que leva a uma apresenta o corporativa do laborat rio da Fujitsu revelando conte dos em formato pdf mostrando o caminho da estrat gia de desenvolvimento roadmap no idioma original da organiza o at 2020 O segundo endere o mostra uma p gina Web com not cias da Fujitsu Research publicadas em 2009 e o terceiro leva a p ginas da Fujitsu Research no seguinte endere o na Web http jp fujitsu com group fri en economic publications report 2008 report 3 10 html Esse endere o apresenta o resumo de um relat rio intitulado Important Factors for Innovation in Physical Distribution and Commercial Distribution 1 Verification of Factors Derived from Case Studies cujo resumo apr
362. robusta com informa o digital sobre neg cios recuperada e apresentada em linguagem natural n o exigindo nenhum tipo de tratamento de dados preliminar minera o Considerando se a vastid o dos ambientes de informa o digital dispon veis atualmente pode se avaliar o tamanho do desafio que toda solu o tecnol gica para minera o textual deve enfrentar A no o de praxis ou de praxeologia neste caso deve ser encarada como uma pr tica de engenharia do conhecimento em constante evolu o buscando se solu es sociot cnicas bastante pragm ticas para os problemas que se apresentam esclarecendo se que solu es de engenharia n o s o geralmente nem exatas nem muito gen ricas mas com aproxima es suficientes e aplica es gen ricas para determinados contextos similares Entretanto pode se afirmar que a solu o metodol gica engendrada tamb m apresenta formalismos que embasam sua fundamenta o t cnica e generaliza o como a An lise de Conceito Formal embora n o sem uma certa dose daquilo que se poderia denominar avalia o conceitual de contexto A classifica o dos objetos sintagm ticos minerados dos textos que tamb m chamamos de inst ncias de conceitos bem representa esse tipo de dificuldade pois tipos caracter sticos de texto poder o exigir modelos de minera o conceitual espec ficos Como exemplo a minera o e modelagem de conceitos a partir dos decretos governamentais no Brasi
363. rough massive amounts of data to learn what motivates and influences consumers choices and buying patterns help identify high value customers and help transform that information into the knowledge and insight necessary to optimize their most lucrative customer relationships O conte do dessa p gina representa o outro lado da moeda em relac o produto inovador da classe Shopping Assistant Technollogy as vantagens para a organiza o que o emprega em suas lojas Com esse tipo de tecnologia o lojista poder conhecer os padr es de compras e consumo dos clientes e atuar da por diante em duas linhas de a o concorrentes em termos de efic cia e efici ncia 1 reter seus atuais clientes com a sedu o da comodidade tecnol gica disposi o pretensamente sem similar nas organiza es concorrentes e 2 competir em posi o vantajosa na busca de novos clientes O respectivo conte do apresentado a seguir na integra sugere como seriam os processos de neg cio para a disponibiliza o desse tipo de produto aos clientes dos clientes da IBM Corporation com aporte tecnol gico desenvolvido pela IBM Research Finding the person hidden in the data Management theories come and go but experience shows that it can cost many times more to acquire a new customer than it does to retain an existing one Savvy businesses understand that their ability to compete successfully in a global marketplace depends on attracting new clientele while co
364. rso til para se monitorar varia es ou inova es de conceitos de neg cio ao longo do tempo c o n vel de interoperabilidade sociot cnica das ontologias produzidas com a metodologia pr ximo da interoperabilidade da pr pria sublinguagem natural utilizada no contexto em estudo pois os conceitos s o expressos nessa sublinguagem restando como nica barreira o conhecimento b sico de reticulados de conceitos e dos modelos de classes da UML ou alternativamente o conhecimento de modelos mentais mais simples por m menos compactos como os apresentados por Ontoria De Duque e G mez 2006 com um n vel de requisitos cognitivos para compreens o bastante elementar 7 2 Modelo de minera o conceitual proposto Em s ntese o proposto modelo de minera o e modelagem de conceitos para gest o do conhecimento de neg cio no suporte a uma praxis de Intelig ncia Competitiva representado no processo da Figura 7 1 Didaticamente as atividades que comp em o processo representadas pelas caixas com arestas arredondadas s o separadas em duas raias sendo uma referente a atividades que pela indisponibilidade de tecnologias de suporte necessitam ser desenvolvidas manualmente e outra referente a atividades semi autom ticas que contam atualmente com softwares de apoio Como produto de engenharia a metodologia tamb m apresenta recursos de configura o de desempenho que pode ser regulada conforma a necessidade da situa
365. rte do sistema cognitivo dos seres humanos possui graves limita es Isso nos leva a um problema de projeto preciso encontrar um meio que reconhe a as caracter sticas centrais da complexidade e ainda assim considere pontos fortes e fracos da cogni o humana Uma vez que nem a capacidade humana nem a complexidade podem ser alteradas preciso encontrar uma forma de estabelecer a liga o entre as duas sem no entanto alter las Em linguagem de engenharia preciso encontrar um dispositivo de interface que estabele a a liga o entre os seres humanos e a complexidade ao mesmo tempo em que preserva as propriedades originais de ambos MCGEE PRUSAK 1994 p 141 142 O segundo ponto tem implica es econ micas imediatas de projeto de sistemas de informa o Sls onde os profissionais da informa o necessitam estimar muito precocemente nos projetos os custos inerentes aos recursos de desenvolvimento para subsidiar os estudos de viabilidade e o planejamento dos investimentos Evidencia se assim o retromencionado paradoxo temporal no ciclo de produ o e consumo de informa es e conhecimento na medida em que a atividade de modelagem de Sls ainda que numa fase preliminar pode consumir expressivo montante de recursos que dever o ser or ados antes da modelagem e sem um certo n vel de modelagem n o ser poss vel elaborar estimativas or ament rias realistas desses recursos para execu o do projeto Quest es
366. s excessivamente esparsa resultando em matrizes de objeto atributo de contexto quase quadradas com N objetos e algo pr ximo a N atributos portanto de pouca utilidade anal tica o teste com os objetos textuais da colet nea Bayer Company ilustra essa observa o emp rica e necessidade de se realizar uma mixagem de conceitos ap s a constru o da matriz de contexto formal da An lise de Conceito Formal a fim de reduzir a prolifera o de conceitos de ontologias superficiais extra das diretamente do l xico Experimentos de Laborat rio Parte Il An lise de Conceito Formal Figura 5 9 Processo Experimental Parte II Fonte do autor da tese 5 6 1 2 Categoriza o aristot lica Com essa frustra o inicial em mente pensou se em um modelo de categoriza o mais compacto e mais b sico acerca das coisas do mundo que suportasse a natural e esparsa distribui o dos atributos sint ticos dos sintagmas sem no entanto permitir um modelo muito esparso de forma o de conceitos E o modelo ent o testado para atendimento desses requisitos inspirou se no modelo de categorias de Arist teles assim apresentado pelo fil sofo grifos nossos Das express es que s o ditas sem qualquer combina o cada uma significa ou uma subst ncia ou uma quantidade ou uma qualifica o ou um relativo ou onde ou quando ou estar numa posi o ou ter ou fazer ou ser afetado toda a afirma o p
367. s o epistemol gica de gest o do conhecimento import ncia fundamental no desenvolvimento das organiza es do S culo XXI poucas solu es metodol gicas e tecnol gicas para sua realiza o se encontram dispon veis concentrando se as solu es mais inovadoras em tecnologias de recupera o da informa o digital nos grandes reposit rios de textos como os corpora idiom ticos e nos conte dos da World Wide Web 5 WWW O uso do arsenal metodol gico e tecnol gico da Intelig ncia Artificial IA como sugerido no contexto da Figura 1 1 deve ser encarado como um recurso estrat gico ainda que instrumental para construc o de pontes lingu sticas ou uma interl ngua entre o conhecimento dos engenheiros de sistemas e dos operadores do neg cio EKLUND ELLIS e MANN 1996 1 3 Minera o conceitual de informa es Como minera o conceitual de informa es define se nesta tese as atividades de reconhecimento de padr es em textos para aprendizado e popula o de ontologias de sistemas organizacionais Os principais antecedentes desse construto epistemol gico s o Recupera o da Informa o Processamento da Linguagem Natural Minera o de Textos Estruturas Conceituais An lise de Conceitos Formais Reticulados de Conceitos e Aprendizado de Ontologias Essas reas de desenvolvimento na Ci ncia da Informa o t m evolu do isoladamente com o uso de recursos computacionais mas n o t m produzido solu e
368. s por serem entidades mais espec ficas t m mais atributos tais como largura e altura na classe Ret ngulo raio na classe C rculo e posi o de v rtice posV rtice na classe Pol gono Os tipos de dados multivalor veis desses atributos s o t picos da geometria indicando dist ncias O tipo de dados denominado Lista de Pontos seria derivado de um sistema de coordenadas geom tricas Observe se tamb m na Figura 4 7 BOOCH RUMBAUGH e JACOBSON 2005 p 65 que as classes t m m todos ou fun es computacionais semanticamente algo parecidos tais como mover redimensionar e exibir mostrar Entre as tr s subclasses os m todos s o os mesmos diferindo as mesmas somente nos atributos Os m todos s o fun es que dever o ser codificadas com algoritmos computacionais adequados na linguagem de programa o adotada pelos desenvolvedores do software 59 E uma classe pode ter nenhum zero um ou mais de um pai ou superclasse de generaliza o Com nenhuma superclasse relacionada uma classe denominada classe raiz ou classe base com apenas uma superclasse a classe utiliza heran a simples e com mais de uma superclasse classe pai uma classe utiliza heran a m ltipla As classes que n o t m filhos subclasses numa rela o de generaliza o s o denominadas classes folha BOOCH RUMBAUGH e JACOBSON 2005 O re
369. s vel uma gest o do conhecimento aut noma e direta com base na comunica o do conhecimento como advogam alguns entusiastas porque o conhecimento algo inerente aos modelos e processos mentais de cada indiv duo portanto sempre t cito O que se tem como conhecimento publicado s o informa es referentes ao conhecimento e n o o conhecimento em si os conceitos de informa o e conhecimento ser o discutidos mais detalhadamente na revis o de literatura A no o de gest o do conhecimento til na medida em que se presume que uma organiza o poder prover seus colaboradores das condi es necess rias para que eles possam a partir de bases de informa es e capacita o t cnica adequadas elaborar e reelaborar seus processos cognitivos e modelos mentais e construir sua pr pria base de conhecimento de interesse para a gest o do neg cio Contudo o aspecto mais interessante no contexto de uma organiza o fundamentada na informa o e no conhecimento que suas bases de informa es e de conhecimento til se encontram geralmente ao alcance da pr pria organiza o mas desestruturadas muitas vezes pouco vis veis como no mosaico informacional t pico desenhado na Figura 1 1 Diversas Fontes de Informa o Organizacional ati atoalaa are a Gatekeepers Figura 1 1 Organiza es Fundamentadas na Informa o e no Conhecimento Fonte do autor da tese Embora se atribua vi
370. s concorrentes tal como mudan as regulat rias novas tecnologias e for a crescente dos clientes SWOT somente um conjunto n tido de listas e n o mais do que isso Algumas vezes interpretar uma matriz SWOT como ler folhas de ch voc as interpreta da forma que deseja Greenwald e Kahn 2005 p 5 reconhecem o valor do modelo de cinco for as de Porter mas adotam uma vis o simplificada em rela o import ncia de cada uma dessas for as 138 Concordamos com a vis o de Porter que cinco for as Substitutos Fornecedores Potenciais Entrantes Compradores e Competidores na Ind stria podem afetar o ambiente competitivo Mas de modo diverso de Porter e muitos de seus seguidores n o pensamos que essas for as s o de igual import ncia Uma delas claramente muito mais importante que as outras E t o dominante que l deres buscando desenvolver e perseguir estrat gias vencedoras deveriam come ar por ignorar as outras e focar apenas nela Essa for a constitu da pelas barreiras contra a entrada a for a subjacente aos Potenciais Entrantes de Porter Se n o h barreiras para entrada ent o muitas preocupa es estrat gicas podem ser ignoradas A empresa n o tem que se preocupar sobre como interagir com competidores identific veis ou sobre como antecipar e influenciar seus comportamentos Simplesmente h muitos deles com que lidar Sem a prote o de barreiras na entrada a nica op
371. s e tecnologias podem ser exploradas em todo seu potencial somente porque tecnologias da Big Science como redes de comunica o de dados sistemas de bases de dados e microcomputadores est o dispon veis no mercado A Association for Computing Machinery ACM publicou recentemente refer ncias a uma vasta cole o de disserta es versando sobre uso de IA em contextos de IR e extra o de conhecimentos de bases de dados e fontes de informa es textuais ACM 2007 As id ias seminais da IA coincidem com os prim rdios do desenvolvimento da ci ncia da computa o quando se imaginava que com a computa o eletr nica se poderia emular o pr prio c rebro humano Observe se que L gica de Predicados Matem tica Ci ncia da Computa o e Ling stica s o disciplinas presentes na Minera o de Textos constituindo o campo de pesquisas interdisciplinares denominado Processamento da Linguagem Natural PLN 22 3 1 2 Cen rio sociot cnico multidisciplinar O cen rio sociot cnico onde se encaixa esta pesquisa multidisciplinar em Ci ncia da Informa o algo parecido com o da poca de Bush e de seu artigo seminal na Ci ncia da Informa o As We May Think que mais tarde incentivaria toda uma comunidade de cientistas no desenvolvimento de m todos e t cnicas para recupera o da informa o SARACEVIC 1999 Simpson et al 1996 contemporaneamente publicaram um artigo na renomada Association for Computing Machi
372. s frontais a nuvem de tags etiquetas com palavras chave para indexa o de conte dos mais recentes geralmente not cias do Web Portal Esses textos tamb m apresentam mais sinais de marca o gr fica da pr pria linguagem Hypertext Markup Language HTML e suas deriva es evolutivas que constituem ru dos nos sinais sem nticos das mensagens necessitando ser eliminados na minera o de conceitos As camadas mais profundas de um Web Portal apresentam textos mais longos alguns parecidos com pequenos artigos apresentando detalhes sobre produtos e sobre a organiza o em si no sentido de convencimento do leitor atual ou potencial cliente sobre as vantagens de um futuro relacionamento com a mesma E nas camadas centrais as mais profundas poss veis tende se a encontrar formul rios para cadastro de clientes aplica es de software com servi os teis para os usu rios para cota o de produtos por exemplo e textos mais longos com conte dos apresentados em formatos mais pr ximos de textos em papel tais como relat rios sobre produtos balan os de neg cios e outros geralmente em formato PDF 111 1 Camada Estruturante 2 Camada Tem tica 3 Camada Informativa Camadas Intermedi rias N Camada de Servi os Camada de Servi os lt Escopo Conceitual Figura 5 5 Camadas de Conteudos em Web Portais Corporativos Fonte do autor da tese Profundidade Analitica
373. s integradas para solu o do problema abordado nesta tese Entretanto minera o da informa o armazenada como dados ou textos n o deve ser confundida com recupera o da informa o pois na minera o da informa o n o se tem um alvo muito espec fico nas buscas em termos de conte dos O interesse da minera o se concentra mais nos padr es de informa o representados na base e menos em informa es indexadas como na recupera o da informa o A recupera o da informa o se concentra em buscas mais espec ficas especificadas pelo usu rio utilizando para isso argumentos de busca que s o termos chave ou conte dos existentes na base subrogada Com os resultados da pesquisa apresentada neste volume procura se evidenciar o potencial desses construtos integrados num framework metodol gico para extra o de informa es textuais teis para modelagem semi autom tica de sistemas organizacionais Os dados de entrada do modelo podem estar presentes nos crescentes volumes de documentos textuais armazenados nos reposit rios digitais das pr prias organiza es dos governos e da WWW Essa abordagem opera como uma engenharia reversa do texto ou seja como o texto representa o resultado de um processo cognitivo lingu stico do autor parte se do texto para descobrir quais s o os modelos mentais dos seus autores e que deram origem ao texto E desse modo tenta se recuperar o conhecimento t cito do autor ou mentor do t
374. scimento assint tico do volume de informa o textual digital dispon vel sobre as organiza es e acirramento da competi o empresarial m todos e t cnicas de Engenharia do Conhecimento para recupera o e modelagem da informa o relevante em reposit rios abertos se tornam cada vez mais importantes para o desenvolvimento de processos de neg cios Com essa motiva o apresenta se uma metodologia inovadora para minera o e modelagem conceitual de informa o textual relevante para suporte a uma praxis de Gest o do Conhecimento apoiando o desenvolvimento de Intelig ncia Competitiva nas organiza es A metodologia testada experimentalmente com simula o computacional emprega recursos de Intelig ncia Artificial integrados em softwares de Processamento da Linguagem Natural combinando num construto epistemol gico e tecnol gico multidisciplinar de Ci ncia da Informa o conte dos de v rias reas do conhecimento cient fico como Lingu stica Filosofia Matem tica Psicologia Ci ncia da Computa o e Engenharia Os conceitos de auto informa o de Shannon 1948 e da diferen a que faz diferen a relativo informa o mais relevante de Bateson 2002 Weick 1995 e Choo 2003 s o centrais no processo de cria o de significado e o princ pio da intelig ncia emergente da Intelig ncia Artificial baseada na natureza norteia o processo de apoio constru o do conhecimento proposto na tese Os produtos resultant
375. sciplinar da recupera o da informa o com processamento da linguagem natural que assim definida DOSZKOCS 1986 p 191 processamento da linguagem natural PLN abrange todas as abordagens baseadas em computador para o manuseio da linguagem irrestritamente escrita ou falada a partir de procedimentos puramente mec nicos como os empregados em muitos editores de textos processadores de palavras e abordagens de indexa o autom tica na recupera o da informa o RI at an lise inteligente compreens o e express o de significado como exemplificado na compreens o da linguagem natural resposta a perguntas e sistemas especialistas na intelig ncia artificial IA O conceito de pragmatismo adotado nesta tese o da doutrina filos fica de Peirce que assim argumenta em rela o escolha desse termo para sua filosofia uma concep o isto o teor racional de uma palavra ou outra express o reside exclusivamente em sua conceb vel influ ncia sobre a conduta da vida de modo que como obviamente nada que n o pudesse resultar de um experimento pode exercer influ ncia direta sobre a conduta se se puder definir acuradamente todos os fen menos experimentais conceb veis que a afirma o ou nega o de um conceito poderia implicar ter se uma defini o completa do conceito e nele n o h absolutamente nada mais Para esta doutrina o presente autor inventou o nome de pragmatismo PEI
376. se s o laddering e ordena o de conceitos concept sorting Schreiber et al 2000 p 199 200 explicam como funcionam essas duas t cnicas de elicita o socializa o do conhecimento 7 Em uma interpreta o baseada no texto de Schreiber et al 2000 p 199 laddering poderia ser traduzida como negociac o de conceitos de dom nio com modelagem gr fica 131 Laddering Laddering uma t cnica um tanto planejada e voc dever explic la inteiramente ao especialista antes do in cio O especialista e o engenheiro do conhecimento constr em uma representa o gr fica do dom nio em termos das rela es entre o dom nio e os elementos de solu o do problema O resultado um gr fico qualitativo de duas dimens es onde os nodos s o conectados por arcos rotulados O gr fico toma a forma de uma hierarquia de rvores Nenhum m todo de elicita o a mais utilizado neste caso mas o especialista e o elicitador constr em o gr fico em conjunto mediante negocia o O ponto chave que tendo se adquirido alguns dos termos chave no dom nio organiz los em alguma forma de estrutura uma coisa natural a se fazer Os termos conceito e atributo devem ser interpretados de modo flex vel no contexto de laddering Por exemplo nenhuma distin o estrita necessita ser feita ainda entre conceitos e inst ncias algo que dif cil nas fases iniciais de modelagem do conhecimento Os ti
377. seguinte forma enquanto identificadores nicos s o utilizados para algumas aplica es e indicadores de classifica o em outros casos h incerteza sobre valores ou significados causando confus o ao leitor humano ou a um programa de computador ou ambos E uma fonte de ambig idade a sem ntica o significado dos s mbolos Outro importante fator que contribui para a redu o dos problemas sem nticos em textos de e sobre uma organiza o o contexto de neg cio em que ela se insere que geralmente tem ontologias e metadados conhecidos ainda que tacitamente pelos seus colaboradores parceiros e clientes Os sintagmas nominais ser o portanto os pontilhados impressionistas de Fuld 2007 que organizados de modo inteligente poder o auxiliar os pr ticos da Intelig ncia Competitiva a reconhecer conceitos chave de neg cio em quest o e compor cen rios para o desenvolvimento de insights teis para sua organiza o Como demonstrado com os resultados de laborat rio no Cap tulo 5 outra vantagem decisiva para a busca de sintagmas com mais de um nome ou plurinominais como estrutura sint tica padr o na minera o de textos sua efici ncia no sentido de representar os substantivos ou nomes mais frequentes em textos desse tipo de fonte O que se pretende com isso propor uma metodologia de organiza o de conceitos expressos em linguagem natural com uso de An lise de Conceito Formal Lingua
378. significam sua imensa base instalada do Sistema Operacional Windows pelo mundo da qual a empresa absorve a experi ncia de milh es de usu rios no APENSO III C apoiando esta premissa o objeto sintagm tico computing experience of millions of people aparece representando o substantivo muito frequente computing Observe se que esses conceitos computer e system s o bastante gen ricos e ao mesmo tempo bastante espec ficos no contexto do neg cio de modo que podem ser utilizados para se alcan ar efetivamente uma ontologia profunda O conceito de computador pode ser instanciado como qualquer dispositivo eletr nico processador de dados digitais o que pode representar num determinado contexto um microprocessador instalado num telefone celular ou num iPod idem para o conceito de sistema os objetos Heckerman s research e intersection of human computer interaction sugerem exatamente esse tipo de interesse Ent o pode se conduzir o racioc nio para se tentar compreender qual seria a linha estrat gica natural para a implementa o de solu es tecnol gicas em reas como a medicina como sugerem os objetos 83 Conceitos mais b sicos da linguagem utilizados no contexto de neg cio 183 da ontologia superficial nesse contexto collaboration with AIDS researchers e life support systems Em rela o ao contexto da IBM do mesmo modo pode se tentar compreender as estrat gicas
379. sions Figura 6 9 Reticulado de Conceitos Formais com Lista de Objetos Contexto IBM Research Fonte do autor da tese 6 1 2 2 Modelos de informa o do contexto Fujitsu Research A Figura 6 10 mostra uma composi o de fragmentos de modelos conceituais de informa o a partir dos seguintes objetos sintagm ticos com substantivos mais freq entes no contexto Fujitsu Research delivery costs delivery routes value in service innovations value pricing visualization of value in service A parte superior da figura evidencia a centralidade do subconceito delivery integrando com relacionamentos de associa o as classes de objetos Delivery Costs associa o Transportation and Delivery Plans e Service importante observar se que a associa o entre Delivery e Service n o obtida a partir da an lise da forma o dos sintagmas mas de uma an lise sem ntica onde se conclui que Delivery Entrega um tipo de Service Servi o ou seja Delivery integra como inst ncia uma classe conceitual denominada Service 158 Contexto Fujitsu Research Transportation Q Transportation Plans Delivery Service Innovations Figura 6 10 Conceitos Integrados em Delivery Service e Value Fonte do autor da tese O resultado experimental da
380. smo gramatical baseado no que denominam regras de estrutura frasal expandida que permite a um analisador sint tico tomar decis es em dom nio espec fico reportando se a um dicion rio e outros arquivos auxiliares produzidos durante uma sess o de aprendizado inicial com o usu rio BALLARD e TINKHAM 1984 p 82 Outros aspectos interessantes do trabalho de Ballard e Tinkham 1984 se referem reminisc ncia das estruturas sist micas de Winograd 1972 e fonte parcial de financiamento de sua pesquisa o Escrit rio de Pesquisas Cient ficas da For a A rea dos Estados Unidos Essa constata o refor a a natureza estrat gica das pesquisas com IA e PLN num contexto espec fico de intelig ncia competitiva o poderio militar O ensaio de Bittelstone 1985 representa uma cr tica ao senso comum dos sistemas especialistas da poca com uma abordagem que poderia ser denominada l gico lingu stica O autor critica especialmente o uso do termo Intelig ncia Artificial IA como atributo de tais sistemas e sustenta que IA n o ser implementada em computadores digitais Contudo sua contribui o real ada na medida em que mostra a utilidade de softwares de processamento de senten as de l gica formal como o PROLOG na an lise sint tica e inferencial de textos em linguagem natural Doszkocs 1986 numa linha de publica o mais tradicional da Ci ncia da Informa o avan a numa abordagem explicitamente multidi
381. so de forma o de uma hip tese explanat ria A dedu o prova que algo deve ser a indu o mostra que alguma coisa realmente operativa a abdu o simplesmente sugere que alguma coisa pode ser Sua nica justificativa que a partir de suas sugest es a dedu o pode extrair uma predi o que pode ser 85 verificada por indu o e isso se que nos dado aprender algo ou compreender os fen menos deve ser realizado atrav s da abdu o O in cio do processo de aplica o da metodologia conforme a fases elencadas no Quadro 4 1 deve ocorrer com a defini o da organiza o ou grupo de organiza es com alguns atributos em comum num contexto de estudo em Intelig ncia Competitiva passando na fase seguinte sele o e recupera o de documentos textuais digitais que melhor representem a identidade estrutura processos de neg cio sistemas e produtos dessa organiza o ou grupo de organiza es Natureza da Atividade e Fase 1 Fase 2 Fase 3 Fase 4 Fase 5 Fase 6 Produto oe o 8 nee E 2 intati oc e Textos t tica kd 2 An lise de NES Infer ncia a2 Conceito 9 2 D amp inic So Formal E Aprendizado An lise Defini o do E a 2 D z Sem ntica ements o Organizacional Contextos Modelos de Insights de Pica n pci Textos SM e Conceitos Informa o Intelig ncia do Formais Conceitual Competitiva Quadro 4 1 Fluxo Operacional Experimental Na terceira fase d
382. soas e outros seres vivos a seguir relacionados aos quais agrade o pelas suas especiais participa es neste meu esfor o intelectivo Ao Sr Carmine Antonio Capuano e Sra Elvira Bini Capuano Sr Cosmo Spinelli e Sra Maria Zancan Spinelli meus saudosos av s e ao Sr Waldomiro Capuano in memorian e Sra Josefina A Spinelli Capuano meus pais que me contaram as primeiras hist rias interessantes sobre o mundo e me ensinaram os primeiros passos da conviv ncia harmoniosa em sociedade apoiando me no in cio de minha jornada de aperfei oamento como pessoa e como profissional A Luzia Bruno Guilherme e Beatriz minha querida fam lia de humanos por aceitarem minhas aus ncias e respeitarem a necessidade de separa o tempor ria para concentra o nas atividades acad micas E a Astrus in memorian Teka Uly Princesa e Boris pelo prazer de sua companhia a qualquer tempo e inspira o cognitiva insights que me proporcionaram em momentos decisivos de minhas reflex es epistemol gicas Aos Profs Drs Rog rio Henrique de Ara jo Jr Cl udio Chauke Nehme Kira Maria Antonia Tarapanoff Ulf Gregor Baranow e Lillian Maria Ara jo de Rezende Alvares todos Ben dell Intelletto que me acompanharam nesta viagem pelo mundo da Intelig ncia Competitiva Agrade o imensamente ao Prof Dr Rog rio Henrique de Ara jo Jr not vel especialista na disciplina Recupera o da Informa o e meu orientador pela sua aten o interesse comp
383. spon vel em http research microsoft com en us about brochure 4 aspx 202 8 REFER NCIAS ACM ASSOCIATION FOR COMPUTING MACHINERY Recent Al related dissertations SIGART Bulletin v 1 n 1 2007 ADOMAVICIUS Gediminas TUZHILIN Alexander Personalization technologies a process oriented perspective Communications of the ACM v 48 n 10 out 2005 AL NEIMAT Taimour Why IT projects fail Dispon vel em lt http www projectperfect com au gt Acesso em 18 jun 2007 ARA JO JR Rog rio Henrique de Precis o no processo de busca e recupera o da informa o Bras lia Thesaurus 2007 ARIST TELES Metaf sica Tradu o de Leonel Vallandro Porto Alegre Globo 1969 ARIST TELES SANTOS Ricardo Org Categorias Porto Portugal Porto Editora 1995 ARMSTRONG Deborah J The quarks of object oriented development Communications of the ACM v 49 n 2 p 123 128 fev 2006 AUER S ren Powl A Web based platform for collaborative ontology Management Dispon vel em lt http www semanticscripting org SFSW2005 papers Auer Powl pdf gt Acesso em 30 nov 2006 BALLARD Bruce W TINKHAM Nancy L A phrase structured grammatical framework for transportable Natural Language Processing Computational Linguistics v 10 n 2 p 81 96 abr jun 1984 BARBUT M MONJARDET B Ordre et classification Algebre et Combinatoire Tome ll Paris Hachette 1970 BARNETT Jim KNIGHT Kevin MANI I
384. ssa atividade Enquanto alguns autores abordam essa atividade na perspectiva de forma o de agrupamentos clusters de termos correlatos considerados como conceitos tais como Hindle 1990 Lin e Pantel 2001 e Reinberger e Spyns 2004 ou mediante a explora o de conex es entre palavras a partir da redu o das dimens es de busca como Sch tze 1993 e Landauer e Dumais 1997 para forma o de clusters outros desenvolvem t cnicas de forma o e popula o de conceitos com a extens o de outros conceitos como Evans 2003 e Etzioni et al 2004 Existem ainda t cnicas de aprendizado de 71 conceitos de modo intensional como no caso do sistema OntoLearn de Velardi et al 2005 que deriva destaques para conceitos de dom nios espec ficos como na WordNet com base em interpretac o composta do significado dos conjuntos de termos CIMIANO 2006 As estrat gias mais conhecidas para indu o de hierarquia de conceitos a partir de textos em linguagem natural s o basicamente tr s Recupera o de termos com base em padr es l xico sint ticos com a aplica o de templates de palavras representando padr es estruturais do idioma tais como os de Hearst 1992 descobre se rela es de interesse para forma o e hierarquiza o de conceitos entretanto os pontos fracos dessa estrat gia s o que certos padr es ocorrem raramente em corpora e por serem padr es sint ticos s o de precis o razo vel mas de bai
385. ssume que essa not cia da diferen a entre dois objetos pode ser representada como uma diferen a dentro de uma unidade de processamento de informa o tal como um c rebro ou talvez um computador O conceito de informa o de Bateson 2002 de compreens o bastante simples no dia a dia dos seres humanos Como exemplo tome se o conceito de not cia de um jornal a informa o publicada por um jornal para ser valiosa precisa ser novidade ou not cia o que do ponto de vista de conte do cognitivo precisa ser diferente de tudo o que j foi publicado anteriormente Ou seja para o leitor uma informa o relevante uma informa o diferente n o faria sentido para ningu m a publica o de uma mesma informa o em n meros subsequentes de um mesmo jornal a n o ser nas se es de an ncios e classificados interessante tamb m o conceito de mente de Bateson 2002 numa tentativa de solu o do conhecido problema filos fico basilar denominado mente corpo um dos temas centrais em 48 O problema mente corpo remonta antiguidade cl ssica e se refere poss vel diferencia o essencial entre a natureza do corpo f sico e da mente humana A corrente dualista com origem mais prov vel em Plat o advoga que corpo e mente s o coisas essencialmente distintas onde o corpo pode ser definido em termos de grandezas f sicas e a mente n o A corrente monista esposada por fil sofos como Parm nides e Espinoza e contem
386. stas conhecida como pontilhismo vigorosa no final do S culo XIX reproduz cenas completas com milhares de pontos coloridos em vez de linhas cont nuas Olhe de perto para qualquer uma dessas pinturas e ver somente pontos Afaste se uns dez passos e ver um campo de flores ou pessoas passeando em um parque com guarda s is abertos Quando voc v toda a pintura voc fica maravilhado como milhares de pontos formaram uma figura coerente e de f cil compreens o Voc percebe o barco a vela claro que como todo escritor tenho a tenta o de usar termos suculentos conhe o adjetivos esplendorosos carnudos substantivos e verbos t o esguios que atravessam agudos o ar em vias de a o j que palavra a o concordais LISPECTOR 1998 p 15 Esses coment rios aparecem na tela de interface de comando do software de an lise sint tica WordSmith Coletados nos meses de junho e julho de 2009 94 balan ar com a brisa o remador rvores pendendo sobre a margem do rio Se voc examinar a imagem novamente voc come ar a perceber mais aspectos sutis os contornos as formas geom tricas as propor es uma torre escondida atr s de algumas rvores ao longe Voc consegue ter perspectiva Essa abordagem de Fuld 2007 apresenta certa semelhan a conceitual com um dos tr s princ pios da Intelig ncia Artificial baseada na natureza o da intelig ncia emergente Conforme Freedman 1995 esse prin
387. t how the organisms genes relate to their functions Researchers at the University of Queensland and a consortium of government academic community and environmental groups collaborate with Microsoft Research on the Health e Waterways project which is developing data management tools to help water resource managers to react to changes in water quality quantity and aquatic species Microsoft has also established more than 30 joint research institutes to support innovative research projects For example Microsoft Research opened three in Europe the University of Trento Centre for Computational and Systems Biology which uses programming language theory to design new computational tools for biology the Microsoft Research INRIA Joint Centre which focuses on longterm research into formal methods and computing security and the BSC Microsoft Research Centre in Barcelona which focuses on the design and interaction of next generation processors Other global joint research institutes include the Games for Learning Institute at New York University which seeks ways to use computer gaming to improve instruction in science math literacy and other academic disciplines We also spearhead Microsoft s academic multi core relations through the Universal Parallel Computing Research Centers a joint activity between Microsoft and Intel that supports client multi core research at the University of Illinois at Urbana Champaign and the University of Calif
388. ta o bastante penosas para o analista usu rio numa tela de computador A experi ncia de Lindig e Snelting 1997 corrobora esta percep o mostrando um reticulado resultante que se parece com um feixe de espaguete com an lise visual praticamente imposs vel O CharGer um aplicativo til para edi o de Gr ficos Conceituais de Sowa 1983 com base nos estudos de Peirce sobre Gr ficos Existenciais e suas limita es s o as comuns em editores de textos com pouca intelig ncia associada 110 5 4 Coleta de dados As estruturas textuais de Web Portais Corporativos apresentam geralmente uma composi o de documentos que se complementam de modo a cobrir todos os conte dos da mensagem para o mundo que as organiza es pretendem propagar Com os primeiros contatos com as fontes selecionadas observou se que os textos da primeira p gina geralmente servem de chamada para textos mais aprofundados nos respectivos temas nas p ginas posteriores os da segunda p gina muitas vezes remetem o leitor internauta para as p ginas seguintes e assim por diante sugerindo se assim uma estrutura de encapsulamento de hipertexto que pode ser modelada como uma cebola Figura 5 5 Os textos das camadas mais externas s o mais curtos e menos densos mas apresentam mensagens mais objetivas e agressivas para os leitores com not cias e cnamadas para produtos e vantagens oferecidas pela empresa Outra caracter stica mais atual dessas p gina
389. tais corporativos para os fins desta tese de camada estruturante de conte dos Os conte dos da 2 camada s o teis por sua vez porque utilizam sintagmas para chamada de temas e servi os de informa o a serem desenvolvidos nas p ginas mais profundas do portal tais como Video Podcast Bayer s Perspective on Innovation Use Mobile Banking Bankrupticy Discharge Research Areas etc nessa camada dos portais que come am a aparecer verbos nos textos sendo mais caracterizada no entanto pela apresenta o dos temas do Web Portal motivo pelo qual a denominamos camada tem tica Com a 3 camada e al m obt m se textos explorando mais profundamente conceitos ou temas do neg cio com uso de sintagmas complexos de alto poder sem ntico muito espec ficos do neg cio geralmente endere ados a p blicos mais especializados tais como Protein Hunters in the Brain Full Faith and Credit Clause Operations Strategy UEFA Champions League Computational linguistics etc Esta camada de conte dos que pode se estender por mais alguns n veis de produndidade no Web Portal caracterizada pela disponibiliza o de informa o nos formatos cl ssicos da era do papel a qual denominamos de camada informativa Os dados param tricos das colet neas extra das dos Web Portais das organiza es selecionadas s o apresentados no quadro do APENSO I Densidade Sintagm tica Plurinominal Amostra de Textos da World Wide Web
390. tal de Transa es de Mercado e Portal de Servi os de Aplica o O primeiro comentado anteriormente dispensa esclarecimentos complementares o segundo pode ser observado em abund ncia na atual Web 2 0 onde muitas empresas disp em para os internautas ambientes de transa es eletr nicas onde o cliente pode escolher o produto que deseja adquirir s vezes at com possibilidade de composi o de partes como no caso dos portais de vendas de computadores e realiza mediante cadastro pessoal pr vio o pagamento via cart o de cr dito Quanto ao terceiro subtipo 6 Esta express o uma tradu o aproximada ou interpreta o de Workplace Portal no original 107 trata se de um portal especializado na disponibiliza o de servi os baseados em softwares onde o cliente busca um recurso tecnol gico para uma aplica o espec fica de seu interesse um cliente poder por exemplo mediante contrato utilizar um sistema de processamento remoto de folha de pagamento disponibilizado nesse portal 5 2 4 Identifica o e sele o de fontes Os dados selecionados na amostra s o cole es de textos de 15 quinze organiza es de v rios portes e ramos de neg cio dispon veis na Web no idioma ingl s A op o por textos neste idioma se deve indisponibilidade de softwares etiquetadores taggers no idioma portugu s para uso em escala de textos e ao fato dele ser o idioma mais comumente utilizado pelas organiza es
391. tantivos que exprimem os conceitos em sintagmas complexos se situam no meio dessa escala de ordem de frequ ncia entre as palavras mais frequentes que s o stop words e as menos freq entes A prop sito Meadow et al 2007 p 208 assim relatam uma experi ncia hist rica com essa propriedade dos textos Luhn 1958 reconheceu que as palavras de freq ncias mais altas tendiam a ser as comuns ou as que n o geravam informa o Ele tamb m sentiu que apenas uma ou duas ocorr ncias de uma palavra num grande texto n o poderiam ser tomadas como significativas para definic o do assunto tem tico Por isso ele sugeriu utilizar se as palavras no meio da amplitude de freq ncia As palavras comuns melhor seriam eliminadas mediante o uso de uma lista de stop words e em rela o s palavras com baixa freq ncia pelo simples descarte daquelas com freq ncia 1 2 ou mais dependendo do tamanho do texto A segunda parte do experimento apresentada a seguir se concentra no problema da composi o das redes de conceitos como suporte metodol gico Gest o da Informa o e do Conhecimento em ambientes de Intelig ncia Competitiva 5 6 Contextos e conceitos formais O pr ximo est gio do experimento de laborat rio consiste na organiza o e apresenta o dos dados coletados na minera o de textos para elabora o dos modelos gr ficos de informa o conceitual que dever o suportar as an lises e gera o de insights para
392. tarRede K C lt transformar B S C lt compactar C s retorne C x A formaliza o do processo apresentada no algoritmo importante para se demonstrar o c lculo l gico matem tico do m todo Ent o partindo do contexto formal K G M I at a rede compactada C lt onde G se refere a objetos M a atributos e s incid ncias a demonstra o a seguir conforme Cimiano 2006 p 97 98 desenvolvida em duas defini es formais Defini o 3 Transforma o de B S em C lt em primeiro lugar a ordem parcial C cont m tanto objetos como conjuntos de atributos C GU B A B B S 9 B1 v 9 A1 B1 U B1 Bz A1 B1 lt A2 B2 Como ACF tipicamente produz um grande n mero de conceitos comprime se a hierarquia de conceitos ontol gicos resultante removendo se qualquer nodo interno no qual a extens o a mesma que a de um conceito filho em termos de nodos folha subsumidos O resultado uma ordem parcial C lt conforme formalizada a seguir Defini o 4 Hierarquia de Conceitos Compactada C lt assumindo se que lext c o conjunto de nodos folha dominado por c de acordo com lt ent o C Co C c C esc c lext co lexi c SSS 0 ee Isto lt a rela o lt restrita aos pares de elementos de C POS Part of Speech parte da fala tag etiqueta de metadados que define a fun o sint
393. te a de que o ser humano n o aprende e utiliza a linguagem de modo at mico mas com base em estruturas que conectam a linguagem a conceitos E de um ponto de vista filos fico Sowa 1984 p 42 argumenta que Conceitos e percepts s o blocos de constru o para a elabora o de modelos mentais Mas regras e padr es s o necess rios para se organizar os blocos de constru o em estruturas maiores Immanuel Kant 1781 introduziu o termo esquema para designar uma regra que organiza as percep es em um todo unit rio 189 QUANDO OBJ C mono gt ACONTECEM ANORMALMENTE E I I I I I I COMPLEXA i l l I l I I L COLABORA ABRANGENTE lt TIPO TIVAMENTE Figura 6 21 Gr fico Conceitual de Warning System no Contexto IBM Research Fonte do autor da tese Em particular os GCs poder o ser utilizados com certo conforto para modelagem de conceitos em pesquisas recursivas de novidades em termos de produtos que podem aparecer na minera o de conceitos como no caso de warning system for automobile A presen a de verbos nos objetos sintagm ticos minerados para modelagem com GCs supre a lacuna deixada pelos modelos conceituais com UML mostrando a a o dos agentes os objetos manipulados por eles e os relacionamentos entre os objetos e as pr prias a es como verbos transitivos exigem complemento
394. tegra os tr s processos cognitivos presentes na utilza o estrat gica da informa o num construto hol stico unificado Esses processos ou arenas de uso da informa o nas organiza es se referem a cria o de significado constru o de conhecimento e tomada de decis es Esse construto hol stico de Choo denominado organiza o do conhecimento que confere s organiza es uma especial vantagem permitindo lhe agir com intelig ncia criatividade e ocasionalmente esperteza CHOO 2008 p 31 Como se pode observar no trecho a seguir Choo se apoia nos mesmos fundamentos de Weick 1995 e na ideia central do pensamento de Bateson 2002 sobre o impacto cognitivo das diferen as no fluxo da informa o A cria o de significado come a quando ocorre alguma mudan a no ambiente da organiza o provocando perturba es ou varia es nos fluxos de experi ncia e afetando os participantes da empresa Essa mudan a ecol gica exige que os membros da organiza o tentem entender essas diferen as e determinar seu significado Ao tentar entender o sentido dessas mudan as um agente dentro da organiza o pode isolar uma parte das mudan as para um exame mais detalhado CHOO 2008 p 33 grifos nossos importante destacar se tamb m as elabora es de Weick 1995 sobre interpreta o e cria o de significado que para ele n o se confundem Weick 1995 p 7 13 advoga que interpreta o litera
395. tem tica aplicada baseado na matematiza o dos termos conceito e hierarquia de conceitos O m todo teve sua origem epist mica em atividades de reestrutura o da teoria matem tica da ordem e do reticulado Wille 2005 observa que mais de uma d cada depois de sua cria o as conex es da ACF com a l gica filos fica do pensamento humano se tornaram claras principalmente em rela o aos ltimos desenvolvimentos da corrente pragm tica da filosofia de Peirce O autor esclarece que com ACF a pr pria matem tica em si se beneficiou citando como exemplo a seguinte tese de sua autoria publicada num artigo recente o objetivo e o significado da matem tica no final das contas se reportam ao fato da matem tica ser habilitada para suportar efetivamente a comunica o racional dos humanos WILLE 2005 p 2 E partindo da premissa que os conceitos s o tamb m pr requisitos para a forma o de julgamentos e conclus es sobre os fen menos Wille 2005 p 2 adapta a tese anterior para a ACF do seguinte modo O objetivo e o significado da An lise de Conceito Formal como teoria matem tica de conceitos e de hierarquia de conceitos suportar a comunica o racional entre humanos mediante o desenvolvimento matem tico de estruturas conceituais apropriadas que podem ser ativadas logicamente Conceitos para Wille 2005 p 2 podem ser filosoficamente entendidos como unidades b sicas do pensamento formadas
396. temas de alerta em redes telem ticas para autom veis Warning System for Automobiles valorado em US 8 bilh es anuais que parece bastante atraente para competidores entrantes portanto a estrat gia de pesquisa e desenvolvimento do produto The Approach que envolve sistemas de informa o em rede e servi os aos clientes em potencial apresentada em linhas gerais ya o atual est gio da pesquisa e desenvolvimento do produto tamb m informado em Next Steps Quando se amplia um pouco a faixa de freq ncia de substantivos que comp em os objetos sintagm ticos dos conceitos com os mesmos atributos Modelo de Tarefa Modelo de Agente Modelo de Insumo e Produto observa se no contexto outros clusters de conceitos lexicais teis tais como application domains application performance diagnosis application wiki O significado de application neste contexto geralmente o de um aplicativo de software mas ocorre tamb m uma express o composta com application com um significado mais tradicional em linguagem corrente sem utilidade no contexto application for his knowledge aplica o para o conhecimento dele O modelo de informa o integrando os tr s conceitos espec ficos mencionados com application no contexto IBM Research apresentado na Figura 6 13 Observe se que o 167 fragmento de modelo resultante pode ser integrado com outro fragment
397. tencem unicamente 149 classe Customer Account e portanto n o podem ser compartilhados conceitualmetne com nenhuma outra classe E isso se explica por uma raz o l gica o saldo da conta banc ria booking position de um cliente informa o til apenas para se avaliar a posi o financeira custommer account desse nico cliente e n o outro Como exemplo desses modelos can nicos de classes de conceitos observe se a Figura 6 4 representando graficamente os sintagmas nominais sistemas de informa o e empresas de controle de pragas A utilidade desse tipo de fragmento de modelo de informa o ou de fatia da realidade de Fuld 2007 pode ser compreendida a partir de um exemplo bastante pragm tico e atual O mercado de cart es de cr dito no Brasil conforme recente edi o do peri dico Exame 2010 se encontra num est gio de importante mudan a estrutural com a perspectiva de entrada de novas empresas ap s a implementa o de medidas governamentais de regula o no sentido de amplia o da concorr ncia a reportagem de 17 p ginas classifica esse evento como a maior reviravolta da hist rica do mercado brasileiro nesse setor EXAME 2010 p 5 Modelo de Objeto com Modelo de Objeto com Dois Substantivos Tr s Substantivos Empresa de Controle de Pragas Informa o Figura 6 4 Exemplos de Classes Sintagm ticas Can nicas Fonte do autor da tese Caso uma organ
398. tend ncia utilizar se aplica es KBS n o como aplica es de usu rios individuais mas em combina o com outras aplica es mais convencionais SCHREIBER WIELINGA e BREUKER 1993 p 151 Esse depoimento importante para se evidenciar no contexto da tese o problema da Ci ncia da Informa o apresentado por Saracevic 1999 com base nas pesquisas bibliom tricas de White e McCain h duas reas principais ou sub disciplinas Em uma das se es est o autores que atuaram no estudo anal tico de literatura suas estruturas estudos de textos como objetos de conte dos nascentes comunica o em v rias popula es particularmente comunica o cient fica contexto social da informa o usos da informa o busca e comportamento da informa o v rias teorias da informa o e t picos correlatos denomine se este grupo de cluster dominante como fizeram White e McCain apesar que b sico poderia ser um bom r tulo Na outra se o est o autores que se concentraram em teoria de IR e algoritmos de recupera o de informa o processos e sistemas pr ticos de IR intera o humano computador estudos de usu rios sistemas de bibliotecas OPAC e t picos correlatos Chamemos este cluster de cluster de recupera o da informa o apesar que aplicado poderia ser tamb m um bom r tulo Infelizmente estes dois clusters principais s o muito desconectados Apenas um n mero mu
399. termos encontrados nas fases anteriores com pares de termos id nticos encontrados em corpora de refer ncia adotados para o estudo geralmente compostos de textos do dom nio em quest o por exemplo se a organiza o que est o sendo modelada da rea m dica provavelmente ser recomend vel utilizar se um corpus como o MEDLINE Esse requisito do m todo se justifica pelo fato comumente observado nesse tipo de busca que se extrai um grande n mero de objetos e rela es que ofuscam a compreens o do dom nio e levam prolifera o de dados para an lise muitas vezes sem correspond ncia dos pares nos corpora de refer ncia para an lise de frequ ncia Assim deve se procurar estabelecer correspond ncia entre as frequ ncias de pares conhecidas presentes nos corpora e desconhecidas presentes nos documentos de entrada no processo mas desconhecidas nos corpora a fim de se reduzir o n mero de pares no modelo de an lise processo que deve se apoiar em estimativas de frequ ncia de pares algo parecidos no contexto Os pares de termos a seguir s o ponderados estatisticamente de modo a estabelecer se algum grau de import ncia respectiva ao dom nio e ao contexto Com isso considera se para a pr xima fase apenas os pares com frequ ncia maior que o limiar definido no processo que compor o o contexto formal no qual ser aplicada a ACF An lise Extra o de Sint tica Depend ncias An lise Estat stica Cons
400. tese quanto mais frequentes os nomes substantivos constitutivos dos sintagmas mais representativos em termos conceituais se tornam os sintagmas 121 plurinominais Considerando se at 1096 dos nomes substantivos mais freq entes o percentual de revoca o com minera o de sintagmas plurinominais varia de 80 a 9096 em m dia podendo at chegar em casos espec ficos a n veis de desempenho pr ximos de 100 As duas curvas do gr fico da Figura 5 4 mostram o espa o de varia o padr o dos percentuais de conex o sintagm tica dos nomes substantivos num texto comum de Web Portal Corporativo Esse espa o varia de um valor calculado como a m dia menos o desvio padr o para um determinado percentual de substantivos mais frequentes at um valor calculado como a m dia mais o desvio padr o nessa frequ ncia importante observar se no APENSO l que quando se tomam apenas os 2 5 de nomes substantivos mais frequentes nas colet neas da amostra obt m se 100 0 de conex o sintagm tica em cinco dos quinze textos ou em 1 3 deles E que esse n vel m ximo de conex o sintagm tica pode ocorrer em textos de organiza es de nichos de mercado t o variados como bancos Bank of America e HSBC siderurgia Hyundai e pesquisa em TIC IBM Research e Microsoft Research a ia LAM 3 q 2 1S E Oo G E E o o S x o c o o 2 596 5 096 7 596 10 0 100 0 Ordem de Maior Frequ ncia M dia Desvio Padr
401. the 14 International Conference on Computational Linguistics COLING 1992 p 539 545 HEHN Herman F Peopleware como trabalhar o fator humano nas implementac es de sistemas integrados de informa o ERP S o Paulo Gente 1999 HESSEN Johannes Teoria do conhecimento Tradu o de Ant nio Correia 7 ed Coimbra Portugal Arm nio Amado Brasil Martins Fontes 1976 HINDLE D Noun classification from predicate argument structures n Proceedings of the Annual Meeting of the Association for Computational Linguistics ACL 1990 p 268 275 HOBBS Jerry R APPELT Douglas E BEAR John TYSON Mabry Robust processing of real world natural language texts In JACOBS Paul S Ed Text based Intelligent Systems Current Research and Practice in Information Extraction and Retrieval Hillsdale New Jersey Lawrence Erlbaum Associates 1991 HOFMANN T Probabilistic latent semantic indexing n Proceedings of the 22 ACM SIGIR International Conference on Research and Development in Information Retrieval 1999 p 50 57 HOSKINS D D DOBBERNACK D KUPTSCH C Eds Social security at the dawn of the 21 century International Social Security Association 2001 IBIBLIO Internet pioneers Vannevar Bush Dispon vel em lt http www ibiblio org pioneers bush html gt Acesso em 13 out 2007 KAO Anne POTEET Stephen R Eds Natural Language Processing and Text Mining Springer 2007 KEIL Frank C WIL
402. tica Computacional e ontologia Tese de Doutorado Belo Horizonte Escola de Ci ncia da Informa o da Universidade Federal de Minas Gerais UFMG 2005 GREENWALD Bruce KAHN Judd Competition demystified a radically simplified approach to business strategy Portfolio 2005 GREFENSTETTE G Explorations in automatic thesaurus construction Kluwer 1994 GREGG Dawn G WALCZAK Steven Adaptive Web information extraction Communications of the ACM v 49 n 5 maio 2006 GUTI RREZ Patricio Balan o do processo de desenvolvimento do governo eletr nico no Chile In KNIGHT Peter Titcomb FERNANDES Ciro Campos Christo CUNHA Maria Alexandra Org e Desenvolvimento no Brasil e no Mundo subs dios e Programa e Brasil S o Caetano do Sul SP Yendis 2007 p 152 p 171 HAMMER Michael CHAMPY James Reengineering the corporation a manifesto for business revolution New York HarperCollins 2001 HARRIES JONES Peter A recursive vision ecological understanding and Gregory Bateson Toronto Canada Buffalo New York EUA e Londres Reino Unido University of Toronto 2002 207 HARRIS Z Mathematical structures of language Wiley 1968 HAVEY Michael Essential business process modeling Sebastopol CA O Reilly 2005 HAYS David G Dependency theory a formalism and some observations Language v 40 n 4 p 511 525 1964 HEARST M Automatic acquisition of hyponyms from large text corpora In Proceedings of
403. to os cl ssicos m todos e t cnicas de Recupera o da Informa o RI continuam sendo teis nesse tipo de miss o cr tica contribuindo para a automa o de processos de busca da informa o digital em ambientes t o complexos e volumosos como a Web Os m todos que mais se aproximam da proposta desta tese como o de Cimiano 2006 apresentam abordagens pouco eficientes para tratamento da ambiguidade e n o completam a ltima fase de um processo padr o de minera o de textos a da cria o de significado E tampouco se mostram teis no apoio a processos de constru o do conhecimento com a necess ria base cognitivista Confirmando a vis o contempor nea de Ci ncia da Informa o de Bates 1999 com uma vis o integrada do processo de minera o de conceitos que se prop e a metodologia desta tese articulando se pe as de conhecimento mono disciplinar num construto multidisciplinar de Engenharia do Conhecimento como num lego O modo de minera o de dados ou textos supervisionado pressup e uma atua o mais intensa do usu rio no sentido da indica o dos caminhos a seguir a cada passo na minera o controlando e calibrando o processo de aprendizado do mecanismo de busca E no modo n o supervisionado pressup e se que o usu rio n o interage com o mecanismo durante o processo de busca esse mecanismo dever no entanto com algoritmos apropriados de Intelig ncia Artificial aprender a se autocalibrar
404. to de id ias surgem categorias combina es hierarquias novas associa es etc que permitir o decidir as id ias ordenadoras b sicas IOB que se identificam com os ramos principais 84 Com a mesma justificativa de Brooks 1980 representou se o racioc nio em termos pseudo matem ticos por entender se que este o modo mais compacto de expressar as id ias de transforma o da informa o em conhecimento no n vel individual como no processo de cria o do conhecimento operacional t cito idealizado por Nonaka e Takeuchi 1997 186 6 2 2 Modelo cognitivo recursivo O modelo b sico de acesso direto poder no entanto ser ampliado com buscas e modelagem de informa o complementar de modo a atender necessidades espec ficas do contexto ditadas pelos operadores do neg cio tais como pormenores tem ticos conceituais n o suficientemente aprofundados no modelo b sico Como exemplo mostrou se no experimento a utilidade de buscas complementares de informa o no Google para esclarecimento de determinados conceitos algo inovadores apresentados nos modelos conceituais integrados como Warning System for Automobiles e Life support Systems Esse modelo ampliado a partir das ramifica es do pensamento nucleado denominado nesta tese modelo recursivo pois ele percorre um caminho no sentido inverso do modelo de acesso direto Figura 6 18 partindo da an lise de conceitos minerados espec ficos dispostos nos
405. to do problema num modelo explicativo multidisciplinar Ou seja parte se da premissa que se pode desenvolver construtos metodol gicos para solu o do problema conectados aos temas disciplinares da Ci ncia da Informa o na vis o evolucion ria de Bates 1999 com uma abordagem t pica de engenharia E a hip tese de partida para desenvolvimento que os recursos dispon veis de Intelig ncia Artificial IA implementados em softwares principalmente de Processamento da Linguagem Natural PLN s o suficientes para suportar a elabora o de uma metodologia eficaz e eficiente para minera o de conceitos de neg cios em textos digitais de fontes abertas com escalabilidade e robustez adequadas para uso em grandes reposit rios de conte dos em linguagem natural Esta abordagem de engenharia na Ci ncia da Informa o inspirada em Bates 1999 necess ria para se testar a hip tese ancorando se tamb m na esp cie fundamental de racioc nio da retrodu o s vezes denominada abdu o mencionada por Arist teles Retrodu o a ado o provis ria de uma hip tese em virtude de serem pass veis de verifica o experimental todas as suas poss veis conseq ncias de tal modo que se pode esperar que a persist ncia na aplica o do mesmo m todo acabe por revelar seu desacordo com os fatos se desacordo houver PEIRCE 2010 p 6 2 4 Relev ncia da pesquisa A pesquisa relevante na medida em que n o se concebe no estad
406. to informa o se encontra associado por exemplo ao desenvolvimento de algoritmos de softwares etiquetadores de textos baseados em Redes de Markov e compressores de sinal eletr nico para comunica o de dados onde a probabilidade de uma pr xima letra numa palavra para reconhecimento da fun o sint tica fortemente influenciada pelas letras precedentes Em contextos menos comportados a surpresa com uma nova informa o num fluxo de eventos pode n o ser t o grande como em contextos onde existem cren as arraigadas O processo indutivo utilizado na ci ncia para generaliza o do conhecimento emp rico por exemplo bastante suscet vel a surpresas podendo apresentar o que Taleb 2007 chama de o impacto do altamente improv vel algo na linha de racioc nio de Popper com a descoberta de cisnes negros quando pela s rie de observa es anteriores pressupunha se a exist ncia de apenas cisnes brancos com a explora o dessas for as contradit rias por um lado a previsibilidade psicol gica das informa es num contexto e por outro lado as incertezas do mundo real das organiza es que se mostra bastante promissora a abordagem do processo de cria o de 78 significado e constru o do conhecimento proposto nesta tese 3 5 2 2 Abordagem ecol gica de Bateson Bateson 2002 p 27 desenvolvendo uma abordagem alternativa da ecologia como ci ncia argumenta que o conceito de diferen a se encontra na ess nci
407. tor mais distra do que tem disposic o uma s rie de escritos e ru dos ou seja uma s rie de movimentos que convivem com a sua leitura como o r dio a TV e a Internet Assim ele mudou o olhar mudou a percep o e a forma de cogni o Quanto terceira linha de pesquisa sugerida concentrada em temas espec ficos da Intelig ncia Competitiva pode se pensar no desenvolvimento de modelos l gicos de racioc nio para miss es e situa es espec ficas tais como as apresentadas por Fuld 2007 e a id ia de diferen a em Shannon apud SAYOOD 2000 Bateson 2002 e Weick 1995 Esse tipo de modelagem poderia simplificar o trabalho dos engenheiros do conhecimento em situa es padr o e situa es surpresa quem sabe com estruturas de conceitos can nicas nas reas de intelig ncia das organiza es interessante como o desafio original de recupera o da informa o continua presente mas agora despertando o interesse de organiza es que desenvolvem tecnologias de ponta como se percebe no discurso de organiza es como a Microsoft Research Improving How Systems Store Retrieve and Present Information Our lives are more data driven than ever yet computing hasn t achieved its full potential to help us manage protect visualize and understand that data For businesses it is important to identify quickly the information that matters and make the right decisions in real time 87 Informa o di
408. tos OO ii uso de fontes de informa o documental textual em linguagem natural para elicita o de objetos de modelagem para AOS e iii possibilidade de apresenta o pict rica de modelos resultantes facilitando o compartilhamento de modelos mentais e o processo de comunica o de conte dos entre analistas de sistemas e usu rios gestores do neg cio As experi ncias de Lindig e Snelting 1997 ilustram o potencial e as limita es desse construto na an lise ontol gica de sistemas de software legados em contextos de reengenharia de sistemas de informa o Estima se sua utilidade tamb m em ambientes organizacionais que necessitam de integra o de dados de sistemas heterog neos como os governos em geral para presta o de servi os baseados em informa o que necessitam do acesso a v rios sistemas para sua composi o e apresenta o ao usu rio 3 4 2 Constru o de rvores de conceitos Embora nas camadas do aprendizado de ontologias da Figura 3 13 se preveja instancia o de axiomas e sua generaliza o o m todo proposto n o emprega tamanho rigor l gico CIMIANO 2006 p 27 A tarefa de popula o de ontologias para os fins a que se destinam neste caso ocorrem em dom nios espec ficos culminando na defini o e extens o de conceitos teis para a modelagem de sistemas de neg cio Com isso n o se corre o risco de cometer erros que justifiquem a an lise axiom tica dispensando se em princ pio a desc
409. tru o An lise de 4 Figura 3 14 Processo de Indu o de Hierarquia de Conceitos Fonte CIMIANO 2006 A rede resultante desse processo transformada ent o numa estrutura de ordem parcial que pr xima de uma hierarquia de conceitos tradicional Como a ACF induz naturalmente a uma prolifera o de conceitos essa ordem parcial compactada com a remo o dos conceitos abstratos comumente produzidos obtendo se uma ordem parcial compactada que a hierarquia 43 Conforme se descobriu no experimento que embasa esta tese cada estrutura sint tica utilizada como padr o de minera o nos textos para se tornar til deve atender a prop sitos espec ficos do projeto e refletir estruturas presentes em quantidade adequada nas fontes de informa o 69 de conceitos resultante Cimiano 2006 p 96 apresenta o processo de aprendizado e populac o de ontologias a partir de textos no algoritmo a seguir Algoritmo Construir Hierarquia de Conceitos D T construir uma hierarquia para termos T com base em documentos D An liseSint tica analisar POS tag D DependSint tica represtags An liseSint tica DependSint ticaLematizada lematizar DependSintatica DependSintaticaEqualizada equalizar DependSint ticaLematizada DependSint ticaPonderada ponderar DependSintaticaEqualizada DependSintatica aplicarLimiar DependSintaticaPonderada K obtenhaContextoFormal T DependSintatica B lt compu
410. tura do acesso a informa es de sistemas 163 Contexto IBM Research Capability K LN Automobiles Performance Monitoring XZ Warning Healthcare Systems Performance Monitoring and System Management pr Warning Delivery and Tracking SZ Q Support Decision Support SZ Management System AS Figura 6 12 Conceitos Integrados em System Fonte do autor da tese Embora esses conceitos mencionados possam representar temas triviais nesse mercado outros conceitos presentes no modelo do contexto IBM Research apresentam algo diferente como Healthcare Delivery and Tracking Systems e Warning Systems for Automobiles Com uma busca recursiva no Google utilizando se IBM Research and Healthcare Delivery and Tracking Systems como argumentos encontra se um nico endere o http domino watson ibm com odis odis nst pages profile jasinksi html que apresenta o conte do textual a seguir com grifos nossos 164 Joe Jasinski Distinguished engineer and program director healthcare and life sciences In an era when healthcare systems are under pressure around the world IBM Healthcare and Life Sciences Program Director Joe Jasinski is helping the medical community transform the practice and delivery of healthcare through the help of IT solutions Today s healthcare environment is facing a global crisis plagued by rapidly risin
411. u testar novas com o m nimo de risco e custo BOOCH RUMBAUGH e JACOBSON 2005 p 5 6 Outra vantagem da modelagem de um sistema de software para os criadores da UML que isto facilita a comunica o na organiza o A atividade de modelagem de um complexo sistema intensivo em software depende para esses metodologistas de uma modelagem adequada como a orientada a objetos mas eles tamb m reconhecem de modo bem humorado a pr tica bem diversa nas organiza es e os contextos mais comuns onde os softwares corporativos s o desenvolvidos BOOCH RUMBAUGH e JACOBSON 2005 p 5 Curiosamente um bocado de organiza es que desenvolvem software come a querendo construir edif cios mas adota abordagens do problema como se estivesse construindo uma casinha de cachorro As vezes tem se sorte Se voc tem as pessoas certas no momento certo e todos os planetas se alinham adequadamente ent o voc pode apenas pode conseguir que sua equipe produza um software que impressione seus usu rios Tipicamente no entanto voc n o pode ter as pessoas certas as pessoas certas est o frequentemente assoberbadas nunca o momento certo ontem teria sido melhor e os planetas nunca parecem alinhar se ao inv s eles se mant m em movimento e fora de seu controle Essas observa es s o importantes no contexto porque uma metodologia de modelagem autom tica ou pelo menos semi autom tica de sistemas de neg cios a partir de informa
412. ue pertence ao conjunto de entidades MASCULINO PESSOA tamb m 49 pertence ao conjunto de entidades PESSOA Neste caso MASCULINO PESSOA um subconjunto de PESSOA O autor observa que o MER uma s ntese dos modelos de dados em rede relacional e de entidades com prop sito de superar os pontos fracos e combinar os pontos fortes de cada um desses modelos anteriores Esse pioneiro argumenta que o MER adota uma vis o mais unificada e natural na qual o mundo real consiste de entidades e relacionamentos incorporando algumas das importantes informac es sem nticas da realidade E que do ponto de vista formal o modelo baseado na teoria dos conjuntos e na teoria das relac es O conjunto de componentes prim rios para a diagrama o Entidade Relacionamento ER composto de objetos de dados atributos rela es e v rios indicadores de tipos O principal prop sito dessa modelagem nos projetos de sistemas de informa o representar os objetos de dados e as rela es entre si A nota o de um diagrama ER relativamente simples e numa das primeiras vers es conforme Pressman 1995 os objetos de dados eram representados por ret ngulos rotulados e os relacionamentos por losangos unindo linhas de relacionamentos entre os ret ngulos das entidades Atualmente as rela es entre objetos s o representadas de modo mais simples ainda sem uso do losango como na Figura 3 3 O modelo da Figura 3 3 com uso da nota o p de ga
413. uinte envolve atividades de folheamento browsing c pia cola paste e arquivo de textos das p ginas pesquisadas colando se os textos copiados de modo sequencial no arquivo partindo se da camada estruturante para as camadas mais profundas do Web Portal Corporativo Os textos s o colados em arquivos gerados pelo software editor de textos em formato txt padr o Unicode O pr ximo passo requer uma decis o pr via sobre o tipo de atividade a ser desenvolvida na sequ ncia caso tratar se da an lise estat stica de palavras tokens do texto sem preocupa o com sua classifica o sint tica deve se partir direto para a an lise sint tica com o software WordSmith caso contr rio ou seja necessitando se da classifica o pr via das palavras para se analisar a frequ ncia de substantivos e de sintagmas plurinominais deve se submeter o texto etiqueta o antes da an lise sint tica e minera o A atividade seguinte consiste na gera o das listas de substantivos e de sintagmas plurinominais com base em listas de palavras tokens etiquetadas anteriormente Essas listas devem ser processadas com o analisador sint tico introduzindo se como argumentos de busca em modo collocation de minera o de textos no software WordSmith os s mbolos de substantivos utilizados pelo etiquetador TreeTagger NN substantivo comum no singular NNS substantivo comum no plural NP nomes pr prios no singular e NPS nomes pr p
414. uivocada da cadeia produtiva no mercado em que se insere a organiza o problema cujos sintomas mais evidentes s o o uso de bases de informa es inadequadas incompletas ou insuficientes O uso do modelo mental da Figura 2 1 para defini o conceitual e pragm tica do problema se justifica pela sua similaridade no contexto Orteg n Pacheco e Prieto 2005 p 15 argumentam em defesa desse modelo de representa o que o processo de planejamento nasce com a percep o de uma situa o problem tica e a motiva o para solucion la A rvore de Problemas da Figura 2 1 constru da com os seguintes procedimentos consecutivos l Analisar e identificar o que se considera como principais problemas da situa o ll A partir de uma primeira tempestade de id ias estabelecer o problema central que afeta os interessados em sua solu o uma comunidade no caso do planejamento estrat gico governamental aplicando crit rios de prioridade e seletividade Il Definir os efeitos mais importantes do problema em quest o IV Anotar as causas do problema central detectado 15 Modelo mental uma representa o pict rica de um fen meno do mundo real utilizado para se obter maior efici ncia em processos cognitivos de an lise para tomada de decis o em contextos 15 V Construir a rvore de problemas desenhando ret ngulos com textos identificando causas e efeitos abaixo e acima do ret ngulo com o texto do proble
415. um contrato que outro classificador garante cumprir isso ocorre entre interfaces classes de implementa o de interfaces e casos de uso e colabora es 58 O padr o atual da UML prev at treze diagramas num modelo de sistema de software representando classes objetos componentes estruturas compostas casos de uso sequ ncias comunica o estados atividades implanta o empacotamento timing e supervis o de intera o Como a ess ncia da modelagem com UML se encontra nas classes e objetos a presente pesquisa concentrar se na representa o do conhecimento com uso desses dois diagramas e do diagrama de atividades Os diagramas de classes e objetos mostram a estrutura est tica das rela es entre as unidades do modelo e o diagrama de atividades as intera es e fluxos de informa es e decis es entre os mesmos Representa o Pict rica Rela o Depend ncia Associa o Generaliza o Realiza o Figura 3 6 Representa o de Rela es na UML Fonte BOOCH RUMBAUGH e JACOBSON 2005 A Figura 3 7 ilustra um modelo com diagrama de classes e rela es de generaliza o entre as mesmas As subclasses espec ficas Ret ngulo C rculo e Pol gono encontram na superclasse abstrata Forma Geom trica seu g nero ontol gico A superclasse no caso apresenta um nico atributo denominado origem cujos dados s o do tipo Ponto as subclasse
416. uma o engenheiro do conhecimento que utiliza simula o computacional desenvolve um modelo do sistema de interesse que imita a complexidade do problema real escreve um programa de computador que implementa esse modelo e utiliza um computador para emular o comportamento do sistema quando submetido a uma variedade de pol ticas ou situa es operacionais PIDD 1988 Como resultados observados das simula es o engenheiro do conhecimento ter ent o dados para an lise e condi es de compor um modelo completo do problema e da melhor solu o poss vel comparando inclusive as implica es de ado o de uma solu o ou outra em termos de desempenho Conforme Pidd o m todo que utiliza simula o pode ser considerado um m todo experimental na medida em que testa um modelo conceitual de problema e solu o Esse autor argumenta no contexto da simula o computacional na Administra o que O modelo utilizado como um ve culo para experimenta o frequentemente com tentativa e erro para demonstrar os prov veis efeitos de v rias pol ticas Ent o 89 aquelas que produzem os melhores resultados no modelo seriam implementadas no sistema real Pidd 1988 p 5 6 A Figura 4 2 apresenta a id ia b sica da simula o computacional como m todo experimental de pesquisa cient fica semelhante ao modelo primitivo caixa preta da Teoria Geral de Sistemas Entradas Modelo de Sa das po
417. uma das primeiras no ramo estava destinada a tornar se a biblioteca de neg cios mais proeminente uma fonte central de informa es No momento da dedicat ria ele explicou por que decidiu doar US 5 milh es enquanto os representantes de Harvard haviam solicitado US 1 milh o Minha vida tem sido dedicada aos neg cios e gostaria de fornecer um novo come o para melhores padr es de neg cios Essa no o de padr es de neg cios de Baker constitui um dos fundamentos dos modelos anal ticos construtivos da Intelig ncia Competitiva de Fuld 2007 e da pr pria minera o de dados e de textos O reconhecimento desses padr es com efeito comp e o que se pode chamar o cora o de diversas metodologias de minera o tais como as do racioc nio baseado em casos Case based Reasoning CBR e de redes neurais artificiais E pode se afirmar tamb m que o reconhecimento de padr es se encontra no cerne da pesquisa cient fica uma vez que a elabora o de modelos para explica o dos fen menos necessita do conhecimento dos padr es observados de manifesta o desses fen menos O autor relata sobre sua experi ncia na Baker Library no in cio dos anos 1980 que abundavam informa es de neg cios de todo tipo nessa biblioteca como pesquisas de investimentos manuais Moody e conte dos da Encyclopedia of Associations Standard amp Poor s e do Register s Outras fontes pr Internet citadas por Fuld 2007 s o Dow Jones
418. ura 5 10 Reticulado de Conceitos 135 Figura 5 11 Reticulado de Conceitos sem Objetos 136 xili Figura 5 12 Reticulado de Fontes e Usos de Informa o para Intelig ncia Competitiva 141 Figura 6 1 Reticulado de Conceitos CommonKADS Modificado amp Forcas de Porter 145 Figura 6 2 Modelos Can nicos de Classes 149 Figura 6 3 Associa o Composi o de Classes 149 Figura 6 4 Exemplos de Classes Sintagm ticas Can nicas 150 Figura 6 5 Modelo Conceitual com Cart o de Cr dito 152 Figura 6 6 Reticulado de Conceitos do Contexto Fujitsu Research 154 Figura 6 7 Reticulado de Conceitos do Contexto IBM Research 156 Figura 6 8 Reticulado de Conceitos do Contexto Microsoft Research 157 Figura 6 9 Reticulado de Conceitos Formais com Lista de Objetos Contexto IBM Research 158 Figura 6 10 Conceitos Integrados em Delivery Service e Value Contexto Fujitsu Research 159 Figura 6 11 Conceitos Integrados em Management Contexto Fujitsu Research 161 Figura 6 12 Conceitos Integrados em System Contexto IBM Research 164 Figura 6 13 Conceitos Integrados em Application e Analysis Contexto IBM Research 168 Figura 6 14 Conceitos Integrados em System Contexto Microsoft Research 174 Figura 6 15 Conceitos Integrados em Computer Contexto Microsoft Research 176 Figura 6 16
419. usca o desenvolvimento de uma solu o ainda que parcial na proposta de pesquisa desta tese poderia ser resumido com a seguinte pergunta objetiva como o arsenal metodol gico e tecnol gico da Intelig ncia Artificial IA poderia contribuir para o desenvolvimento de processos autom ticos ou semi autom ticos de transforma o de informa o textual das e sobre as organiza es em conhecimento ontol gico til para a modelagem de seus sistemas de neg cios O como no caso se reporta a m todos e t cnicas de Processamento da Linguagem Natural PLN com recursos de Intelig ncia Artificial IA buscando se rotas de desenvolvimento de uma solu o metodol gica para este problema desafio que na Ci ncia da Informa o comentado por Ferneda 2006 Ebecken Lopes e Costa 2005 Benabdellatif 2002 e outros O modelo que define o contexto e a estrutura epistemol gica do problema num recorte de Gest o da Informa o e Conhecimento apresentado na Figura 2 1 onde o artefato denominado rvore de Problemas representa um construto desenvolvido por pesquisadores da rea de planejamento estrat gico e adotado como um dos pilares conceituais da Metodologia do Marco L gico do Instituto Latinoamericano y del Caribe de Planificaci n Econ mica y Social ILPES De um ponto de vista dos fluxos de informa es nas organiza es a baixa capacidade competitiva pode resultar principalmente de uma percepc o eq
420. uso do arsenal de IA na RI a partir dos anos 1980 Os artigos de Koll 1979 Lebowitz 1983 Zarri 1983 Tong Askman Cunningham e Tollander 1985 Breuker e Wielinga 1987 Belew 1987 Brachman e 18 Considerando se que em geral cada obra citada tem como refer ncias mais de uma dezena de outras obras correlatas pode se estimar o volume de publica es nessa rea nos ltimos 50 anos o artigo citado apresenta os resultados da aplica o de um SRI denominado AIR sobre a conhecida base de informa es jur dicas WESTLAW nos EUA 21 McGuinness 1988 e Rose e Belew 1989 apenas ilustram essa guinada hist rica que coincide com o ressurgimento do interesse acad mico sobre a IA ap s as frustra es do per odo anterior Cooper um pesquisador da rea de biblioteconomia apresentou o problema ainda na d cada de 1980 da seguinte forma Recupera o da informa o inclui uma preocupa o com sistemas especialistas ou baseados no conhecimento e seus futuros sucessores improv vel que sistemas sofisticados desse tipo possam ser desenvolvidos de modo a utilizar uma linguagem inteiramente natural sem assist ncia de uma teoria avan ada e unificada da linguagem e da l gica COOPER 1984 p 259 Outro conceito chave correlato ao trabalho programado nesta tese o de minera o de textos uma variante evolutiva do conceito de minera o de dados entendendo se minera o de dados como o pro
421. utor da tese Observa se na Figura 6 7 que existem 13 objetos sintagm ticos classificados como tendo atributos apenas de tarefa 75 objetos com atributos de insumo e produto e um objeto com atributos apenas de agente mas existem 18 objetos com esses tr s atributos herdados A estrutura do reticulado permite v rias outras an lises de relacionamentos entre conceitos como an lises envolvendo clusters de objetos com atributos de ambiente externo que s o especialmente interessantes por raz es bvias do ponto de vista da Gest o da Informa o e do Conhecimento para Intelig ncia Competitiva 156 Modelo de Insumo e Produto Figura 6 8 Reticulado de Conceitos do Contexto Microsoft Research Fonte do autor da tese Em rela o ao conceito estudado com mais pormenores herdando os atributos tarefa agente e insumo e produto o contexto Microsoft Research apresenta 23 objetos instanciadores Observa se tamb m 73 objetos compondo conceitos com inserc o inclusive nos atributos Modelo de Organiza o e Modelo de Ambiente Externo no contexto IBM Research e 48 objetos no contexto Microsoft Research Os 18 objetos sintagm ticos do conceito de processos de neg cio do contexto IBM Research s o apresentados na Figura 6 9 caixa mais escura Como se pode observar uma visualiza o mais confort vel de reticulados de conceitos em geral exige telas
422. ver como algo que um todo logicamente composto pelas suas partes Composi o uma forma restrita de agrega o onde a exist ncia de suas partes depende do todo O todo o propriet rio das partes Descreve como algo que um todo composto de partes individuais TR 0 1 Departamento C 1 membro gt vinculado gt 0 1 A 1 diretor frequenta gt lt ensina d Figura 3 8 Relacionamentos Estruturais Fonte WEILKIENS e OESTEREICH 2007 T1 Embora pare a que a distin o entre uma agrega o e uma composi o n o seja muito clara na UML um crit rio conceitual deve ser utilizado para tanto uma composi o ao contr rio de uma agrega o n o admite instancia o Ou seja uma classe que representa uma parte no todo de uma composi o n o pode pertencer a mais de uma composi o simultaneamente como numa associa o entre as classes Carro Motor e Barco um objeto motor real como uma inst ncia da classe Motor n o pode ser agregada a um carro e a um barco simultaneamente Outro aspecto importante da UML que tem conex es profundas com as estruturas sint ticas da linguagem natural se refere s propriedades e atributos dos objetos Conforme Weilkiens e Oestereich 2007 p 42 uma propriedade uma caracter stica estrutural especial que se 61 pertence a uma classe um atributo mas que tamb m pode perte
423. vos Fonte do autor da tese O detalhamento dos componentes de um objeto conceitual poder ser executado com Gr ficos Conceituais GCs como no caso de warning system for automobile ilustrado na Figura 6 21 Esse modelo se baseia num fragmento do texto On the Drawing Board pesquisado com o Google utilizando se os argumentos de busca IBM e warning system com conjunto sobre os sistemas de alarme para ve culos desenvolvidos pela organiza o IBM Research dispon vel no endere o eletr nico http domino research ibm com odis odis nsf pages board 02 html Os GCs s o interessantes quando se busca conhecer melhor detalhes constitutivos de conceitos isolados ou conceitos tipo tamb m chamados de esquemas por Sowa 1984 de coisas mais pr ximas do mundo material pois seu emprego em conjuntos de conceitos abstratos com muitos relacionamentos e sub tipagens poder resultar em gr ficos muito polu dos algo desconfort vel para consultas visuais o modelo da Figura 6 21 resultou dos conte dos de apenas cinco linhas de texto Como exemplo de aplica o pr tica em ambientes de Intelig ncia Competitiva executivos do neg cio com pouco tempo para leitura de textos t cnicos sobre produtos poder o se beneficiar com a leitura de Gr ficos Conceituais O poder dos GCs ressaltado na obra de Sowa 1984 com base em pesquisas psicol gicas no tema cogni o cuja verifica o mais importan
424. vos em Sintagmas Plurinominais Amostra de Textos da WWW APENSO III A An lise de Conceito Formal Contexto Fujitsu Research APENSO III B An lise de Conceito Formal Contexto IBM Research APENSO III C An lise de Conceito Formal Contexto Microsoft Research APENSO IV Dados de Sensibilidade a Conceitos Novos Contexto Microsoft Research vi RELA O DE ABREVIATURAS E SIGLAS AAAI Association for Advancement of the Artificial Intelligence ACF An lise de Conceito Formal ACM Association for Computing Machinery AIDS Acquired Immunodeficiency Syndrome AIO Arquitetura de Informa o Organizacional AOL America On Line AOS Arquitetura Orientada a Servico ART Adaptive Resonance Theory ASIST American Society for Information Science and Technology BIW Business Insights Workbench CAD Computer Aided Design CBR Case based Reasoning CELM Customer Equity and Lifetime Management CEO Chief Executive Officer CommonKADS Common Knowledge Acquisition and Documentation Structuring CPF Cadastro de Pessoa F sica CPLN Sistema de Conhecimento e Processamento da Linguagem Natural CRM Customer Relationship Management CSE Conventional Software Engineering DNA Deoxyribonucleic Acid EDGAR Electronic Data Gathering Analysis and Retrieval ER Entidade Relacionamento ERP Enterprise Resource Planning EUA Estados Unidos da Am rica FCI UnB Faculdade de Ci ncia da Informa
425. ware com GCs 3 3 4 Linguagem de modelagem unificada A Linguagem de Modelagem Unificada UML uma linguagem gr fica para visualiza o especifica o constru o e documenta o de artefatos de sistemas intensivos em software BOOCH RUMBAUGH e JACOBSON 2005 O potencial da UML no contexto avaliado em fun o de sua utiliza o na ind stria do software sendo a linguagem padr o de modelagem orientada a objetos mais disseminada nas organiza es As origens da UML remontam d cada de 1980 quando metodologistas de modelagem de sistemas computacionais assumiram o desafio de desenvolver uma nova linguagem de modelagem para complexos projetos de software com linguagens de programa o orientadas a objetos tais como Smalltalk Objetive C C e Eiffel O desenvolvimento de uma linguagem de modelagem de sistemas envolve dois aspectos fundamentais o escopo e alcance da linguagem que se refere s suas funcionalidades e o equil brio entre expressividade e simplicidade Booch Rumbaugh e Jacobson 2005 com rela o a este dualismo observam que um ponto de equil brio crucial pois uma linguagem de modelagem muito simples poder limitar a amplitude de problemas que ela pode resolver e uma linguagem muito complexa poder se tornar inating vel por desenvolvedores mortais A primeira vers o da UML foi liberada ao p blico em 1995 e desde ent o a linguagem vem sendo aprimorada com vers es mais atuais a atual a 2 0
426. winner s research Web and mining logs of Internet queries in search O reticulado de conceitos formais da Figura 6 1 dever servir de guia para an lise dos fragmentos de modelos de informa o apresentados a seguir representando uma plataforma meta ontol gica para Intelig ncia Competitiva Observa se com uma leitura de cima para baixo no reticulado que os objetos conceituais se dividem originalmente em um bloco caixa mais escura relativo a organiza es substitutas ou entrantes novas no mercado e a organiza es consideradas concorrentes players atuais Em seguida os atributos ou intens es desses objetos s o compartilhados tamb m por organiza es externas bloco de Clientes Consumidores e internas bloco de Parceiros derivando tamb m um tipo de organiza o concorrente mais gen rico sem nome de bloco que herda atributos tanto das organiza es do bloco substitutos e entrantes como do bloco Players Atuais Os conceitos de parceiros e clientes e consumidores se originam do conceito de players atuais e os conceitos de substitutos entrantes players atuais e clientes consumidores originam de modo combinado um segundo bloco conceitual de concorrentes identificados por objetos do ambiente externo que se referem a agentes no modelo CommonKADS Modificado A id ia de guia metodol gico se refere necessidade de mapeamento ou encaixe dos conce
427. xa taxa de revoca o recall outros autores que desenvolvem essa estrat gia s o Buitelaar et al 2004 com padr es sint ticos al m dos de Hearst 1992 explorando as estruturas internas de frases nominais para derivar rela es taxon micas I Hip tese distributiva de Harris utiliza abordagens de clustering para derivar automaticamente hierarquias de conceitos a partir de textos em linguagem natural aproveitando se a dupla vantagem da clusteriza o i forma o de conceitos e ii indu o de hierarquia de conceitos A pot ncia das t cnicas de clusteriza o se revela na medida em que ao formarem os clusters de palavras similares que s o naturalmente extens es de um conceito elas permitem a generaliza o dessas extens es para forma o de conceitos que representam essas extens es ordenando os clusters hierarquicamente Os autores dessa estrat gia s o Faure e Nedellec 1998 Bisson et al 2000 e Cimiano et al 2004 Ill An lise de co ocorr ncia de termos na mesma senten a par grafo ou documento conforme Cimiano 2006 a t cnica de Sanderson e Croft 1999 por exemplo apresenta uma no o de subsun o baseada em documento onde um termo t mais espec fico que um termo t gt se t aparece em todos os documentos em que t ocorre Existem poucas abordagens de aprendizado de rela es ontol gicas de textos publicados na literatura aparecendo o trabalho seminal de M dche e Staab 2000 como o ma
428. xterno Tarefa e For as do Ambiente Externo Insumo amp Produto e e Mercado Ambiente Externo Tarefa Insumo amp Produto j Outros Organiza o Ambiente Externo e e e 143 Objetos como Fujitsu Group consultants from IBM e bulk of Microsoft researchers se referem a organiza es espec ficas mas objetos como business activity monitoring e management issues in partnership se referem a outras formas de organiza o gen ricas business e partnership Objetos que apresentam atributos de agentes nesse macro conceito s o considerados como provavelmente referentes a clientes e parceiros da organiza o no mercado Como exemplo explanat rio um objeto referente sintagm tico como Fujitsu Research Institute que se refere apenas ao macroconceito ou ideia de Estruturas Corporativas tem o sentido de uma Organiza o concorrente no contexto de mercado em estudo por isso devendo ser classificado em Players Atuais nas For as de Porter Em outro exemplo objetos referentes que s o classificados em termos de macroconceito e sentido como Estruturas Corporativas e Organiza o Agente Tabela 6 1 t m atributos de Porter como Players Atuais e tamb m como Parceiros Ou seja esses objetos se referem a organiza es que est o no mesmo nicho de mercado que a patrocinadora do esfor o de Intelig ncia Competitiva mas n o s o concorrentes compondo a pr
429. xto a fun o da arquitetura da informa o seria a de estrutura o do ambiente informacional para viabilizar os processos de gest o LIMA MARQUES e MACEDO 2006b p 250 Os modelos organizacionais mencionados que dever o ser abordados na tese s o modelo de organiza o modelo de processos com inst ncias relativas a tarefas agentes insumos e produtos e modelo de ambiente externo organiza o O problema com os projetos de sistemas de informa o computacionais SICs evidenciado nas pesquisas do Standish Group relatados por exemplo por Nevo e Wade 2007 e Luna Reyes et al 2005 e as frustra es com as TIC relatadas por Davenport 2000 McGee e Prusak 1994 revelam apenas a ponta do iceberg de um cen rio adverso para as organiza es informatizadas que para Bates 1999 poderia ser o paradigma acima da linha d gua O que est abaixo da linha d gua s o as pr ticas de campo da Ci ncia da Informa o ou seja as 47 metodologias e as TIC respons veis pelo xito ou fracasso da gest o da informa o e do conhecimento nas organiza es E uma defini o de modelo organizacional bem abaixo da linha d gua a de Schreiber Wielinga e Breuker 1993 Um modelo organizacional prov uma an lise do ambiente s cio organizacional no qual o KBS ter que funcionar Ele inclui uma descri o das fun es tarefas e gargalos na organiza o SCHREIBER WIELINGA e BREUKER 1
430. y as 150 locations Meanwhile IBM Research is exploring ways to refine Personal Shopping Assistant technology with customer sensitive features such as suggesting a wine to go with a meal or providing dietary guidance on specific items Hesearchers see Shopping Buddy as a prime candidate for moving Web technology closer to the physical world with for example ads targeted to individual consumers based on prior purchases in the precise environment where they are primed to make a purchase just as camera ads show up on your computer screen when you query your search engine for camera IBM researchers also say the technology could be extended to other retailers and retail sectors IBM Personal Shopping Assistant puts technology at shoppers fingertips giving them better control over their shopping experience and provides retailers with a practical on demand solution For more information on IBM Personal Shopping Assistant and to explore other ways to enhance retail commerce contact IBM Research Services today Obviamente trata se de um tipo de servi o inovador baseado em sistemas de informa o com bastante aporte computacional destinado em princ pio para orienta o de clientes de grandes lojas de departamentos em suas expedi es de compras da o conceito de assistente de compras shopping assistant Deve se ressaltar a prop sito que esse tipo de servi o ao cliente est previsto na rota evolutiva prevista para
431. zation techniques and tool usability maintainability and extensibility Our scientific research is grouped into four Research Units Plant ecology Ecological networks Spatial ecology and biogeography Behavioural ecology To facilitate the above research and computational ecology more widely we develop Tools for Ecoinformatics and Biodiversity Informatics Tools for Environmental Management and Education Com base nos conte dos das p ginas desse primeiro endere o na Web o programa de pesquisas da Microsoft Research na linha de suporte vida bastante amplo e apresenta curiosamente duas vertentes em direc es opostas mas partindo do mesmo conceito central baseado nos sistemas naturais a primeira vertente se refere ao desenvolvimento de sistemas computacionais de apoio s pesquisas sobre a vida no planeta Terra com temas atuais como a ecologia a segunda se refere emula o de sistemas naturais em computadores ou o que essa organiza o denomina computa o natural natural computation algo que se parece com a Intelig ncia Artificial baseada na natureza 175 Obviamente esse programa de pesquisas multidisciplinar e o autor revela tratar se de uma iniciativa de longo prazo que dever ser desenvolvida na interface da biologia qu mica engenharia e tecnologia da informa o explorando a computa o inspirada na natureza e a computa o biol gica Contexto Microsoft Research ZS
Download Pdf Manuals
Related Search
Related Contents
Funk-Videoüberwachungsset mit Babyphone-Funktion Set Xerox Phaser 6700 User's Manual 5 - Mike Channon`s Directory of HTC Service and User Manuals Cellular Line CIRIPHONE3GT AmpliVox S500-WT User's Manual SkyLink TD-434 User's Manual 小諸市通話録音装置貸与実施要綱 平成27年3月24日 告示第31号 PHYSIQUE - CRSIC Univ Msila Copyright © All rights reserved.
Failed to retrieve file