Home

Análise de dese icardo Klein Lorenzoni

image

Contents

1. 23 4 1 Princ pios da Elelneldada e S E a 23 dl ie CU d 23 Boles PENS O 5o an ba Anal Aa 25 43 3 opt ei E eco s 26 4 1 4 Energia Consumida consumo 27 4 2 Equipamentos para medi680 ssec iiie ceci Ee etate c 27 4 2 1 Dranetz Power Platform PP4300 esses 27 4 2 2 Oscilosc pio Agilent DSO1002A 28 4 2 3 Ponta de prova de tens o cete NSI anke NANESE kode kake 29 4 2 4 Fonte para calibra o da ponta de prova 29 ESTUDO DE CASO ooer io o o k a ei ni 31 5 1 Descri o dos Equipamentos a 33 Sm Rs E DRE E 94 5 lsat 94 5 2 Ambiente do Execu o 35 5 2 1 Sistema Operacional nn 35 5 3 Pinipack ARE nune Eo tto 96 6 rtr 39 7 CONSIDERA ES FINAIS d eR A A ENA DNA NR ENE 43 8 TRABALHOS FUTUROS re nanai le a 44 9 REFERENCIAS BIBLIOGR FICAS ie 45 VI LISTA DE TABELAS Tabela 1 Especifica es ARM e x86 esee enhn nnne nnne nennen 35 Tabela 2 Consumo m dio na execu o do algoritmo eene 39 Tabela 3 Tempo m dio de execu o do algoritmo
2. seen 39 Tabela 4 26 redu o de consumo e tempo de execu o utilizando otimiza es na Arquitetura VII LISTA DE FIGURAS Figura 1 Plataforma BMI Dranetz PP4300 27 Figura 2 Ponta de prova de corrente TR2510 sese 28 Figura 3 Oscilosc pio Agilent DSO1002A 28 Figura 4 Ponta de prova de corrente 11464 sessi 29 Figura 5 Ponta de prova de oscilosc pio LF 20A seen 29 Figura 6 Fonte ICEL PS 1500 ee inniti rnnt s inhaerens e nnne nans 30 Figura 7 Esquema de liga o dos equipamentos 32 Figura 8 Esquema de liga o dos equipamentos CPU 33 Figura 9 Especifica es de Energia BeagleBoard seen 34 Figura 10 Fatora o da Matriz nana 37 Figura 11 Tela principal do IntuiLink Data Capture 3 90 sss 51 Figura 12 Tela de configura o para recuperar os dados do oscilosc pio 52 Figura 13 Ligando o aparelho sessi ea 54 Figura 14 Inicializa o do Dranetz sss sienne nnne nnne nnne en nnne 54 Figura 15 Selecionando a sondagem de corrente seen 55 Figura 16 Selecionando
3. FREE SOFTWARE FOUNDATION INC GCC Development Mission Statement Dispon vel em lt http gcc qnu org gccmission html gt Acessado em nov 2011 GOMES P H LEITE T S CAETANO U A Arquitetura ARM Dispon vel em lt http www ic unicamp br rodolfo Cursos mc722 2s2005 Trabalho g20 arm pdf gt Acessado em mar 2011 GUSSOW Milton Eletricidade b sica 2 edi o S o Paulo Makron Books 1996 HEWITT P G F sica Conceitual 9 Edi o Porto Alegre Bookman 2002 IDA Cesar Ossamu Benchmarks Dispon vel em lt http www inf ufrgs br gopd disc cmp134 trabs T 1 001 benchmarks Benchmarks p2 htm Acessado em nov 2011 INTEL Introducing the 45 nm Next Generation Intel amp CORE TM microarchitecture White Paper Dispon vel em lt http www intel com technology architecture silicon intel64 45nm core2 whitepaper pdf gt Acessado em mar 2011 LILJA David J Measuring computer performance A practitioner s guide Cambridge UK Cambridge University Press 2000 MANO M Morris Computer system architecture 3 edi o Englewood Cliffs EUA Prentice Hall 1993 MALUTA T Compara es de Performance ARM vs x86 Em Algoritmos Simples de Ordenacao Wordpress 2008 Disponivel em lt http escovandobits files wordpress com 2008 04 arm vs x86 pdf gt Acesso em mar 2011 MARINHA DOS ESTADOS UNIDOS Curso de eletricidade B sica 1 edi o Rio de Janeiro Hemus 1998 46 MORIMOTO C E
4. Processador de 32 bits 16 registradores de uso geral Conjunto de instru es extens vel com o uso de coprocessadores Instru es b sicas similares ao 6502 Instru es de tr s endere os Capacidade de executar instru es de 16 bits usando a arquitetura Thumb Baixo consumo de energia Tamanho do n cleo reduzido At 16 coprocessadores l gicos GOMES LEITE e CAETANO 2011 A arquitetura ARM foi desenvolvida para possibilitar implementa es muito enxutas sem deixar de lado o alto desempenho Isso poss vel pela simplicidade dos processadores ARM Importante lembrar que implementa es pequenas implicam em baixo consumo de energia o que torna esses processadores interessantes para aplica es m veis GOMES LEITE e CAETANO 2011 A tecnologia ARM que iniciou seu desenvolvimento em 1978 vem crescendo cada vez mais no mercado nos ltimos 10 anos tendo em vista que n o possui nenhum concorrente direto no mercado possui uma grande fatia do mesmo na rea de processadores embarcados principalmente no ramo de SmartPhones e Tablets A Arquitetura ARM vem se tornando cada vez mais uma tend ncia e pode vir a se tornar um grande concorrente aos processadores da Intel AMD entre outras com a atual proposta da Microsoft desenvolvedora do Windows que pretende tornar seu 18 principal produto compativel com essa tecnologia a partir da proxima versao do sistema operacional O ARM tipica
5. e Instru es com comprimento vari vel e Instru es que manipulam operandos na mem ria Possuem um conjunto de instru es com tamanho vari vel Codifica es de conjuntos de instru es de comprimento vari vel utilizam diferentes n meros de bits para codificar as instru es dependendo da quantidade de entradas da instru o dos modos de endere amento utilizados e de outros fatores Ao utilizar a codifica o de comprimento vari vel cada instru o toma apenas o espa o de mem ria que necess rio se bem que muitos sistemas exijam que todas as codifica es de instru es tenham um n mero inteiro de bytes de comprimento Utilizar um conjunto de instru es de comprimento vari vel pode reduzir a quantidade de espa o ocupado por um programa mas aumenta enormemente a complexidade da logica necess ria para decodificar as instru es uma vez que partes da instru o como operandos de entrada podem ser armazenadas em diferentes posi es de bit em diferentes instru es Al m disto o hardware n o pode predizer a localiza o da pr xima instru o at que a instru o atual tenha sido decodificada o suficiente para que ele possa saber o comprimento da instru o atual CARTER 2003 Conforme Murdocca e Heuring 2000 importante notar que os arquitetos de computadores aprenderam que instru es CISC n o funcionam muito bem em arquiteturas com pipeline Para que pipeline funcione de forma efetiva
6. o atual n o um desvio Isto faz com que seja mais f cil para o processador utilizar pipelining para melhorar o desempenho ao sobrepor a execu o de v rias instru es CARTER 2008 19 3 MENSURA O DO DESEMPENHO Neste cap tulo ser apresentado um pouco a respeito dos motivos para os quais se pode medir o desempenho assim como algumas das m tricas definidas para se quantificar o desempenho Utilizar m tricas para demonstrar o desempenho se faz necess rio para que se possam comparar dois equipamentos distintos de forma imparcial 3 1 MFLOPS Milh es de Instru es de Ponto Flutuante por Segundo Conforme Silva e Prado 2010 As unidades mais comuns de medida de desempenho em processamento de alto desempenho s o a MFLOPS Millions of floating point operations per second ou Megaflops Segundo Tsukamoto 2010 a velocidade de processamento de um supercomputador medida em FLOPS Floating Point Operations Per Second ou seja quantidade de opera es de ponto flutuante por segundo Ainda segundo Tsukamoto 2010 os supercomputadores atuais atingem velocidades na grandeza dos petaflops PFLOPS o que equivale a quatrilh es de c lculos por segundo FLOPS ou flops acr nimo de computa o que significa Floating point Operations Per Second que em portugu s quer dizer opera es de ponto flutuante por segundo Isto usado para determinar o desempenho de um computador especificamente no campo d
7. 1993 Segundo Fowler 1992 a unidade base de corrente denominada amp re que igual a 1 coulomb por segundo A corrente el trica o resultado do movimento de cargas el tricas A unidade SI de corrente o amp re cujo s mbolo A os s mbolos utilizados s o o para uma corrente constante e i para uma corrente vari vel no tempo Se um fluxo constante de 1C de carga passa por um dado ponto em um condutor durante 1 s a corrente resultante 1 A O MALLEY 1993 O movimento ou o fluxo de el trons chamado corrente Para se produzir corrente os el trons devem se deslocar pelo efeito de uma diferen a de potencial A corrente representada pela letra A unidade fundamental com que se mede a corrente o amp re A Um amp re de corrente definido como o deslocamento de um coulomb atrav s de um ponto qualquer de um condutor durante um intervalo de tempo de um segundo GUSSOW 1996 Segundo Fowler 1992 a abreviatura para ampere A Por exemplo para indicar que a corrente num fio de 10 amp res escrevemos 10 A 24 Onde corrente A O carga C coulomb T tempo 5 CORRENTE ALTERNADA A corrente alternada se comporta da maneira sugerida pelo proprio nome Os eletrons se movem no circuito primeiro em um sentido depois no sentido oposto oscilando para ca e para l em torno de posi es fixas Isso realizado por uma altern ncia de polaridade da voltagem do gerador ou de outra fonte
8. 256 KB 2W Ubuntu 11 04 2 6 38 4 arm linux gnueabi gcc 4 5 2 Intel Pentium 4 HT 3 0E Especifica o SL7PM 3 014 GHz 1 1 2 2 512 MB DDR 333MHz 32KB dados 32KB instruc es 1024Kb 84W Ubuntu 11 04 2 6 38 8 gcc 4 5 2 5 2 Ambiente de Execucao Neste cap tulo apresenta se o ambiente de execu o do trabalho especificando o Sistema Operacional utilizado e o motivo o compilador escolhido para compilar os programas e o software livre utilizado como benchmark 5 2 1 Sistema Operacional O sistema operacional escolhido para a instalac o nos equipamentos para a mensura o do desempenho e do consumo foi o Ubuntu 11 04 Natty Narwhal 36 Uma das principais motiva es da escolha por este que o mesmo possui suporte completo a microarquitetura ARM desde a sua vers o 9 04 Jaunty Jackalope A instala o do sistema operacional Ubuntu 11 04 no cart o de mem ria SD utilizado na placa BeagleBoard REV C3 foi realizada conforme UbuntuWiki 2011 A vers o do kernel nos equipamentos durante as execu o dos testes eram 2 6 38 4 na placa com processador ARM e 2 6 38 8 no computador com processador x86 Para compilar os algoritmos utilizou se por padr o o GCC vers o 4 5 2 que est dispon vel para ambas as arquiteturas de processadores Para compilar o algoritmo foram utilizadas algumas das optimiza es fornecidas pelo gcc para este trabalho optou se por utilizar as opti
9. Fonte Laboratorio do DCEEng A sequ ncia de imagens abaixo ilustra os passos para a configuragao da escala de fatores Figura 18 Acessando a op o 5 ADVANCED SETUP OPTIONS ii m Power Platform 4300 Fonte Laboratorio do DCEEng 57 Figura 19 Acessando a op o 1 SET INPUT CONFIGURATIONS geo Power Platform 4300 Fonte Laboratorio do DCEEng Figura 20 Acessando a op o 3 SET SCALE FACTORS Fonte Laboratorio do DCEEng Ajustamos cada canal para utilizando as op es NEXT CHAN e ENTER SCALE e pressionando o teclado num rico para a entrada dos numeros que fique conforme a imagem abaixo lembrando que utilizaremos apenas o canal A para realizar as medi es 58 Figura 21 Ajuste do fator de escala dos canais Fonte Laboratorio do DCEEng Apos pressionamos duas vezes o botao EXIT para retornar ao menu principal das configura es No menu principal de configura es apresentamos os passos para configurar a frequ ncia de opera o para 60Hz Figura 22 Acessando a op o 4 SET SYNC PARAMETERS Fonte Laborat rio do DCEEng A op o SYNC MODE dever ficar como External e a op o NOMINAL FREQUENCY dever ficar com o valor 60 0 conforme figura abaixo 59 Figura 23 Ajustando a frequ ncia da rede el trica Fonte Laboratorio do DCEEng Apos pressionamos duas vezes o botao EXIT para retornar ao menu
10. AGRADECIMENTOS Em primeiro lugar agrade o a Deus por estar sempre presente em minha vida por iluminar o meu caminho em todos os momentos em todas as minhas conquistas e me aben oar todos os dias com uma fam lia maravilhosa A toda a minha fam lia principalmente meu pai minha m e e meus irm os pelo apoio incondicional esfor o e escolhas que sempre fizeram em prol de minha educa o e forma o Tamb m a minha namorada pela cumplicidade amizade companheirismo e amor sempre demonstrados A todos os professores que participaram da minha forma o como pessoa cidad o e profissional pelas suas contribui es e conselhos dados dentro e fora da sala de aula participando direta ou indiretamente da maioria das escolhas feitas por mim durante todo esse per odo de forma o e que continuar o a me influenciar durante o resto de minha vida Ao meu orientador por ter me guiado e me indicado os caminhos a seguir nos momentos de d vida durante a pesquisa e realiza o do trabalho Aos colegas pela amizade troca de ideias e conhecimentos durante toda a forma o acad mica onde todos batalharam arduamente em busca do sonho da gradua o Ao GAIC Grupo de Automa o Industrial e de Controle pela concess o de uso dos equipamentos que necessitei para a realiza o deste trabalho Tamb m ao bolsista aluno e amigo Bruno Mokan Muenchen pelas contribui es ao meu trabalho auxiliando nas pesquisas e na realiza o dos test
11. aplicagao para recuperar os dados novamente Para reiniciar a coleta de dados no osciloscopio ap s a recuperagao dos mesmos Aperte no oscilosc pio o bot o force local e ent o inicie a coleta de dados novamente apertando o botao run stop Ap s recuperar os dados gerados pelo oscilosc pio voc ter abertos no IntuiLink 3 janelas uma com os waveforms da tens o uma com os waveforms da corrente e uma imagem que apresenta a voc a tela do oscilosc pio no momento da recupera o das informa es As waveforms foram salvas no computador em formato csv ap s isto foram abertos em excel e manipulados para ent o serem utilizados no trabalho 53 Anexo D Boot BeagleBoard pela Serial Este anexo apresenta a sequencia de comandos utilizados para fazer o boot na BeagleBoard atrav s de um computador conectado a mesma pela porta serial sudo apt get install gcc 4 5 arm linux gnueabi arm linux gnueabi gcc mult seguencial c sudo apt get install minicom sudo minicom s configura o da porta serial A Dispositivo Serial gt dev ttySO F Controle de Fluxo por Hardware gt N o sair do minicon sudo minicom OMAP3 beagleborad org mmcinit OMAP3 beagleborad org bootd omap login ubuntu password temppwd 54 Anexo E Configura o Dranetz Power Platform 4300 Abaixo apresentamos tr s manuais sobre o aparelho utilizado nas medi es de energia sendo os manuais
12. cada instru o necessita ter similaridades com outras instru es pelo menos em termos da complexidade relativa das instru es Desta forma percebe se o motivo de hoje os processadores da arquitetura x86 serem h bridos CISC RISC onde o processador recebe instru es CISC e as converte em instru es RISC buscando otimizar o processamento atrav s do uso de pipeline 17 2 1 2 Arguitetura ARM Conforme Murdocca e Heuring 2000 a arguitetura RISC tem algumas caracteristicas gue a diferem da arguitetura CISC Todas as instru es t m tamanho fixo Todas as instru es efetuam opera es simples que podem ser iniciadas no pipeline a taxa de uma por ciclo de clock Operag es complexas s o agora constru das a partir de instru es simples pelo compilador Todos os operandos devem estar em registradores antes de serem modificados Existe uma classe distinta para instru es de acesso a mem ria LOAD e STORE Esta chamada de arquitetura LOAD STORE Modos de enderegamento sao limitados Calculos complexos de endere os s o feitos usando se de sequ ncias de opera es simples Deve existir um numero grande de registradores de uso geral para opera es aritm ticas para que vari veis tempor rias possam ser armazenadas em registradores em vez de em uma pilha na mem ria MURDOCCA e HEURING 2000 Segundo Gomes Leite e Caetano as principais caracter sticas da arquitetura ARM s o as seguintes
13. de voltagem Aproximadamente todos os circuitos de CA comerciais na Am rica do Norte envolvem voltagens e correntes que se alternam de um lado para o outro com uma frequ ncia de 60 ciclos por segundo Isso d origem a uma corrente de 60 Hertz HEWITT 2006 Uma fonte de tens o alternada Tens o ca inverte ou alterna periodicamente a sua polaridade Consequentemente o sentido da corrente alternada resultante tamb m invertido periodicamente Em termos do fluxo convencional a corrente flui do terminal positivo da fonte de tens o percorre o circuito e volta para o terminal negativo mas quando o gerador alterna a sua polaridade a corrente tem de inverter o seu sentido GUSSOW 1996 Segundo Roditi 2005 a corrente el trica que possui varia o peri dica em geral senoidal com o tempo sua magnitude medida no seu valor m ximo ou no seu valor quadr tico m dio Na corrente alternada a cada ciclo ocorre uma invers o no sentido da corrente s mbolo ac ca AC ou CA CORRENTE CONTINUA Corrente cont nua se refere ao fluxo de cargas em um nico sentido Uma bateria produz uma corrente cont nua em um circuito porque seus terminais sempre possuem a mesma polaridade Os el trons se movem do terminal negativo que os repele para o terminal positivo que os atrai sempre no mesmo sentido de movimento ao longo do circuito HEWITT 2006 A corrente cont nua passa atrav s de um condutor ou de um circuito somente num s
14. e assim deixar seus softwares melhor ajustados a estas tecnologias aumentando ainda mais a efic cia das mudan as realizadas pelos fabricantes Com rela o aos processadores com arquitetura ARM vale ressaltar que os mesmos come aram a ser desenvolvidos em 1983 com seu primeiro modelo ficando pronto em 1985 por m n o chegou ao mercado Em 1986 a Arcon lan ou no mercado o ARM2 desde l foram lan adas mais 9 vers es do chip Segundo Prado 2011 o diferencial dessa arquitetura com rela o a arquitetura x86 que ela segue alguns princ pios como ser um RISC de alta performance ter o tamanho do n cleo reduzido ter um baixo consumo de energia e excelente custo benef cio Segundo Gomes Leite 8 Caetano 2005 em 1986 o ARM2 era o processador de 32 bits mais simples com apenas 30 000 transistores mas ainda assim superava o desempenho de muitos processadores RISC ou CISC mais complexos como o 286 da Intel A ARM Ltd que a respons vel pelo desenvolvimento dos chips e detentora dos direitos sobre a arquitetura n o produz os processadores se limitando a licenciar os projetos a pre os m dicos para outros fabricantes que podem optar por diversos tipos de licen a que v o de simples licen as para produzir os chips a op es que permitem modificar os chips incluir 13 componentes adicionais ou at mesmo ter acesso completo ao micro codigo e desenvolver chips compativeis MORIMOTO 2011 Esta liberdade co
15. entrada AC 115 230V 4 2A e frequ ncia entre 50 60Hz 5 1 2 A BeagleBoard A Beagleboard e um dispositivo alimentado por USB de baixo custo que nao necessita de cooler uma placa Unica com o desempenho e a expansibilidade de um computador mas sem o volume a despesa e o ruido causado por maquinas desktop tipicas BEAGLEBOARD 2009 A Beagleboard utiliza um processador OMAP3530DCBB72 a 720MHz e vem com um pacote POP de 4mm POP pacote em pacote uma t cnica onde as mem rias NAND e SDRAM s o montadas sobre o OMAP3530 Quanto alimenta o da placa ela pode ser feita atrav s de um cabo USB alimentado por uma CPU ou ent o atrav s de uma fonte Utilizou se a alimenta o por cabo USB pois n o tinha se uma fonte para alimentar a placa Figura 9 Especifica es de Energia BeagleBoard Specification Min Typ Max Unit Power USB Host Same as the DC supplied by the power plug or USB 5V Current Depends on what the DC source can supply over what the board reguires Fonte BeagleBoard System Reference Manual 35 Tabela 1 Especifica es ARM e x86 Configura o BeagleBoard Rev3 Pentium IV Processador Modelo Frequencia de clock processadores core Threads core total threads RAM Cache L1 Cache L2 Cache I3 TDP maxima Watts SO Kernel Compilador ARM Cortex A8 TI OMAP 3530 600 MHz a lc 256MB LPDDR RAM e 256 MB NAND Flash 32 KB
16. entre o resultado obtido no benchmark e o consumo m dio do aparelho Tabela 6 Desempenho Watt Desempenho Watt x86 ARM x86 ARM Linpack GFLOPS 3 986 0 02356 169 185059 Consumo Wh 158 38 1 193 132 757754 MFLOPS W 25 16732 19 7485331 1 27438929 Na tabela acima possivel verificar as diferengas entre as duas arguiteturas durante a execu o do benchmark Linpack Pode se observar nesta tabela que o resultado da execu o do teste HPL quase 170 vezes melhor na arquitetura x86 do que na ARM o consumo de energia 132 75 vezes maior mas no momento em que verificado o desempenho por Watt destas maquinas esta diferenga fica em apenas 1 27 vezes maior um valor realmente pequeno tendo em vista as diferen as no resultado do teste e no consumo de energia O c lculo realizado na tabela acima para verificar o desempenho por watt foi realizado da mesma forma que feito na lista top500 onde eles utilizam o melhor resultado obtido no teste HPL e divide se o mesmo pelo consumo Na lista top 500 pode se verificar isso dividindo o valor que consta na coluna Rmax pelo valor da coluna Power e o resultado obtido se encontra na coluna Mflops W att 43 7 CONSIDERA ES FINAIS A hip tese que deu in cio ao trabalho tinha como tema de pesquisa averiguar se uma m quina com processador ARM seria capaz de substituir m quinas desktop utilizadas pela maioria dos usu rios Para a realiza o do trabalho foi necess
17. essent 63 Figura 32 Alterando a visualiza o da medi o de 63 Figura 33 Alterando para a pr xima visualiza o da medi o de energia 64 Figura 34 Tela utilizada para acompanhar as medi es de energia 64 Figura 35 Acessando o menu de configura es sssses enne 65 Figura 36 Acessando a op o 4 MEMORY FUNCTIONS sess 65 Figura 37 Acessando a op o 1 MEMORY CARD FUNCTIONS sss 66 Figura 38 Acessando a op o WRITE CARD para salvar os dados coletados 66 Figura 39 Salvar os dados coletados no cart o sesssseeeenenen 67 VIII Figura 40 Removendo o cart o de mem ria na frontal direita do aparelho 67 Figura 41 Salvando os dados para o computador sese 68 Figura 42 Tela principal do Dran View sess seen nnne nnne nnne nnn 68 Figura 43 Selecionando as informa es desejadas sse 69 1 INTRODU O Nos ltimos 30 anos a discuss o a respeito do esgotamento dos recursos naturais como os combust veis f sseis aumento da polui o e aumento exponencial de consumo de recursos energ ticos tem aumentado a cada ano Na ltima d cada essas discuss es passaram a ganhar ainda mais for a contando n o s com o apoio dos eco
18. for muito alto ent o o sistema come a a paginar e o desempenho diminui sensivelmente Se N for muito baixo mais computa o poderia ter sido feita em cada n NB NB Figura 10 Fatora o da Matriz Para estimar o valor NB deve se iniciar com valores de 32 ou 40 e entao tentar fazer NB o maior possivel Uma vez encontrado um bom valor para NB valores de multiplos pares de NB expressos pela formula 2 i NB 38 devem dar bons resultados tamb m Como N e NB s o relacionados desejavel gue N seja multiplo de NB para evitar computag es residuais Os valores de P e O est o relacionados ao numero de processos tal que P Q NumProcessos A regra de ouro ter O gt P e possivelmente Q 2 P ou P sqrt N SILVA 2009 39 6 RESULTADOS As medi es realizadas na etapa inicial do trabalho tinham por objetivo adquirir o conhecimento do consumo dos equipamentos em estado ocioso Os resultados obtidos nestas medi es s o os seguintes O processador da arquitetura ARM faz um consumo m dio de 0 9431 Wh enquanto o processador x86 faz um consumo de 90 9836 Wh Com estes valores pode se observar que o processador arquitetura x86 utilizado sem realizar nenhuma tarefa consome 96 47 vezes mais energia que o processador da arquitetura ARM Na tabela 2 est o descritos os valores m dios de consumo para a execu o do algoritmo de multiplica o de duas matrizes de ordem 1000 mil nas duas arquiteturas exe
19. hora KWh por ser maior e mais conveniente O KWh n o uma unidade SI O n mero de KWh consumidos igual ao produto da pot ncia absorvida em KW e o tempo durante o qual ocorreu esse consumo W quilowatts hora P quilowatts X t horas O MALLEY 1993 4 2 Equipamentos para medi o Neste subcap tulo sugerem se alguns equipamentos que podem ser utilizados para medir as grandezas citadas no subcap tulo anterior O Objetivo disso adquirir um conhecimento m nimo a respeito de equipamentos utilizados na medi o de grandezas el tricas e fazer uso de alguns deles para a realiza o do trabalho 4 2 1 Dranetz Power Platform PP4300 O Dranetz Power Platform 4300 e um eguipamento de alta precisao gue fornece inumeros tipos de dados ao usuario como a Tensao Corrente Pot ncia Consumo e Consumo instantaneo Suas medidas podem ser extraidas atrav s de memoria flash e analisadas por meio do software Dran View uma ferramenta do software proprietaria do fabricante do equipamento Figura 1 Plataforma BMI Dranetz PP4300 28 4 2 1 1 Ponta de prova de corrente TR2510 A ponta de prova de corrente TR2510 uma das pontas de prova de corrente espec ficas para ser utilizada no Dranetz Simples e f cil de usar para que comece a informar os dados coletados por ela basta conectar no aparelho e lig lo Por m interessante que se verifique no Dranetz se a escala est travada em 1A Figura 2 Ponta de pro
20. o tipo de sonda utilizada 2 10 55 Figura 17 Tela principal do aparelho acessando a tela de configura es 56 Figura 18 Acessando a op o 5 ADVANCED 56 Figura 19 Acessando a op o 1 SET INPUT CONFIGURATIONS eee 57 Figura 20 Acessando a op o 3 SET SCALE FACTORS 57 Figura 21 Ajuste do fator de escala dos canais sse 58 Figura 22 Acessando a op o 4 SET SYNC 58 Figura 23 Ajustando a frequ ncia da rede el trica sse 59 Figura 24 Acessando a op o 5 SET INTERVAL FOR TIMED READINGS 59 Figura 25 Ajustando o intervalo em 5 segundos de medi o dos dados 60 Figura 26 Ligando o aparelho sse nena 60 Figura 27 Inicializa o do Draneiz nana 61 Figura 28 Confirmando a utiliza o de sondagem de corrente 61 Figura 29 Definindo o tipo da sonda utilizada seen 62 Figura 30 Acessando menu para desabilitar canais desnecess rios 62 Figura 31 Canais B C e D desativados sssss
21. op o SETUP para acessar as fun es do cart o de mem ria 65 Figura 35 Acessando o menu de configurag es Fonte Laboratorio do DCEEng Figura 36 Acessando a op o 4 MEMORY FUNCTIONS Fonte Laboratorio do DCEEng 66 Figura 37 Acessando a op o 1 MEMORY CARD FUNCTIONS Fonte Laboratorio do DCEEng Figura 38 Acessando a op o WRITE CARD para salvar os dados coletados Fonte Laborat rio do DCEEng Para salvar os dados no cart o basta pressionar as op es WRITE EVENTS WRITE SETUPS e WRITE BOTH 67 Figura 39 Salvar os dados coletados no cart o Fonte Laborat rio do DCEEng Ap s salvar os dados basta desligar o aparelho para remover o cart o de mem ria Figura 40 Removendo o cart o de mem ria na frontal direita do aparelho Fonte Laborat rio do DCEEng 68 Figura 41 Salvando os dados para o computador Fonte Laboratorio do DCEEng Sao 3 arquivos HCI EVT HCI SET HCI MDB que o Dranetz gera os quais salvamos no computador sendo utilizado apenas o arguivo HCI EVT devido ao fato de ser armazendo neste arquivo os ltimos 20 minutos de medi o onde a cada medigao de 10 minutos salvava se os dados no computador nao sendo necessarios os demais arquivos Para visualizar os dados gerados utilizamos o software Dran View 6 0 Entrerprise trial A vers o do programa utilizada foi a Enterprise que esta disponivel para download em lt h
22. processadores CISC o uso de um decodificador CISC RISC pois o processador trabalha internamente executando instru es RISC mas aceita apenas instru es CISC que no processador s o decodificadas e ent o processadas em formato RISC O design de um conjunto de instru es de um computador deve levar em considera o n o apenas a constru o de uma linguagem de m quina mas tamb m os requerimentos impostos no uso de programa o com linguagens de alto n vel A tradu o de linguagens de alto n vel para linguagem de m quina feita por compiladores Uma raz o para que a tend ncia seja de um conjunto de instru es complexo o desejo de simplificar a compila o e aumentar a performance como um todo A tarefa de um compilador gerar uma sequ ncia de instru es de m quina para cada conjunto de c digos de alto n vel A tarefa simplificada se houverem instru es de m quina que implementam diretamente os conjuntos de c digos de alto n vel O objetivo principal de uma arquitetura CISC tentar 16 prover uma nica instru o de maquina para cada c digo escrito em uma linguagem de alto nivel MANO 1993 Segundo Mano 1993 as principais caracteristicas dos processadores CISC Um grande numero de instru es tipicamente de 100 a 250 instru es e Algumas instru es que desempenham tarefas espec ficas e n o s o usadas com tanta frequ ncia e Uma grande variedade de modos de endere amento
23. referentes configura o inicial configura o para a medi o de energia e procedimentos para salvar os dados em cart o de mem ria transfer ncia dos arquivos para o computador e opera es com o software Dran View O manual ser composto pelo passo passo formado por imagens com observa es caso necess rio Configura o inicial A configura o do equipamento Dranetz Power Platform 4300 foi realizada conforme manual de usuario disponivel em lt http dranetz com pdf powerplatform4300 multi daq taskcard operatorsmanual gt Figura 13 Ligando o aparelho Fonte Laborat rio do DCEEng Figura 14 Inicializagao do Dranetz 55 Fonte Laborat rio do DCEEng Apos inicializar o aparelho guestiona se desejamos selecionar sondagem de corrente Basta pressionar o botao correspondente a opgao YES Figura 15 Selecionando a sondagem de corrente Fonte Laboratorio do DCEEng Na tela seguinte devemos selecionar o tipo de sonda utilizada TR2510 em nosso caso utilizamos apenas o canal A ignorando os demais canais Neste caso ja esta correto o modelo da sonda basta pressionar EXIT Figura 16 Selecionando o tipo de sonda utilizada TR2510 Fonte Laboratorio do DCEEng Na tela principal do aparelho pressionamos o botao SETUP para acessar as configura es necess rias antes das medi es 56 Figura 17 Tela principal do aparelho acessando a tela de configurag es
24. rio fazer um estudo mais detalhado a respeito dos sistemas operacionais a arquitetura dos processadores conceitos sobre eletricidade e benchmarks Com base na hip tese foram escolhidos alguns tipos de benchmarks a serem executados em uma m quina desktop e em uma m quina com processador ARM com a finalidade de conseguir comparar as duas Com rela o a desempenho as duas arquiteturas ainda apresentam uma diferen a muito grande em favor da arquitetura x86 sendo entre 17 5 e 21 6 vezes maior nesta arquitetura por esta ser desenvolvida especialmente para apresentar alto desempenho sem ter em vista a economia de energia J o processador da arquitetura ARM apresentou um consumo de energia realmente reduzido Pode se concluir ent o que se o usu rio busca um equipamento para fazer uma grande quantidade de processamento onde necess ria uma resposta imediata do processador e com a execu o mais r pida poss vel aconselh vel que se continue utilizando os processadores da arquitetura x86 pois se encaixam melhor s necessidades do usu rio Ja se o objetivo de uso do equipamento para utiliz lo como um servidor de arquivos ou para fazer downloads em suma tarefas que n o exijam grande poder de processamento recomend vel que o usu rio busque por tecnologias alternativas visto que com isso a redu o de consumo de energia pode chegar a quase 100 vezes fazendo o uso de um processador da arquitetura ARM 44 8 TRA
25. uso de todos os recursos do sistema OBAIDAT e BOUDRIGA 2010 Benchmarks de aplicativos reais incluem varios programas inteiros gue refletem uma carga de trabalho de um usu rio padr o Tais cole es s o frequentemente chamadas de su tes de refer ncia Eles t m a vantagem de que todos os aspectos dos programas selecionados s o capturados Os resultados de desempenho produzidos s o significativos para os usu rios para os quais o pacote de benchmark representa as cargas de trabalho t pico RAUBER e RUNGER 2010 23 4 MENSURACAO DO CONSUMO Neste capitulo serao apresentados alguns conceitos basicos de eletricidade como tensao corrente pot ncia e consumo e em seguida alguns equipamentos que podem ser utilizados para medir essas grandezas 4 1 Principios da Eletricidade Nesta subsegao serao definidos alguns dos principios da eletricidade como a corrente alternada a corrente continua Tensao e Pot ncia para depois com o conhecimento te rico a respeito desses t picos discutir a respeito dos mesmos no desenvolvimento do trabalho 4 1 1 Corrente Corrente el trica o movimento de part culas carregadas numa dire o especifica Esta part cula carregada poder ser tanto um el tron quanto um ion positivo ou um ion negativo Esta part cula denominada com portador de corrente O movimento pode ser atrav s de um solido um g s um liquido ou o v cuo FOWLER 1992 GUSSOW 1996 O MALLEY
26. BALHOS FUTUROS Realizar testes com otimiza es O3 e Os nos mesmos equipamentos para verificar qual das otimiza es proporciona um melhor desempenho com o menor consumo de energia Realizar testes com um n mero maior de equipamentos de ambas as arquiteturas visando obter um valor de refer ncia e buscar propor um selo de qualidade de consumo efici ncia no uso de energia baseado no desempenho de processamento dividido pela quantidade de watts consumidos Realizar testes de consumo em diversos computadores compilando diversos algoritmos com todas as flags de otimiza o proporcionadas pelos compiladores e verificar o consumo de energia realizado em cada compila o com a ideia de buscar definir a flag que proporciona o maior ganho de desempenho e a melhor redu o no consumo de energia Baseado na tabela 4 criar uma otimiza o para o GCC que favore a principalmente a redu o no consumo de energia do equipamento 45 9 REFERENCIAS BIBLIOGRAFICAS BEAGLEBOARD BeagleBoard System Reference Manual Rev C3 2009 Disponivel em lt http beagle s3 amazonaws com design Beagle SRM C3 0 0 pdf gt Acessado em nov 2011 CARTER Nicholas Arquitetura de Computadores Sao Paulo Bookman 2003 DAS Lyla B The x86 Microprocessors Architecture Programming and Interfacing 8086 to Pentium India Pearson Education 2010 FOWLER R J Eletricidade princ pios e aplica es 2 edi o S o Paulo Makron Books 1992
27. Chips ARM Entendendo as diferengas entra o Hummingbird Snapdragon OMAP e Tegra Hardware Disponivel em lt http www hardware com br artigos arm entendendo diferencas gt Acesso em mar 2011 MURDOCCA Miles J HEURING Vincent P Introdugao a Arquitetura de Computadores Rio de Janeiro Campus 2000 OBAIDAT Mohammad S BOUDRIGA Noureddine A Fundamentals of performance evaluation of computer and telecommunication systems New Jersey John Wiley amp Sons 2010 O MALLEY J An lise de Circuitos 2 edi o S o Paulo Makron Books 1993 PRADO Claudio L SILVA Jo o M A Aplica o de cluster Beowulf em institui es de ensino 2010 119 f Monografia Gradua o em Tecnologia em Inform tica nfase em Redes de Computadores Faculdade de Tecnologia de Guaretingueta Guaretingueta 2010 PRADO S A onipresente arquitetura ARM Dispon vel em lt http www sergioprado org 201 1 02 24 a onipresente arquitetura arm gt Acessado em mar 2011 RAMOS Nelson A Avalia o e compara o de desempenho de computadores metodologia e estudo de caso 2008 60 f Monografia Gradua o em Engenharia da Computa o Universidade Federal de Pernambuco Recife 2008 RAUBER Thomas RUNGER Gudula Parallel programming for multicore and cluster systems 1 edi o New York Springer 2010 RODITI Dicion rio Houaiss de f sica 1 edi o Rio de Janeiro Objetiva 2005 ROQUE Tania Como funci
28. MALLEY 1993 O malley 1993 diz que a diferen a de tens o entre dois pontos tamb m chamada de diferen a de potencial o trabalho necess rio em joules para mover 1C de carga de um ponto a outro A unidade SI de tens o o volt cujo s mbolo V O s mbolo de tens o V ou v sendo utilizados tamb m E ou e Assim W joules i la Q coulombs 26 4 1 3 Pot ncia Para Fowler 1992 a pot ncia se refere a quao rapidamente a energia usada ou convertida noutra forma de energia Desde gue a energia a capacidade em realizar trabalho pode se dizer que a pot ncia esta relacionada com a rapidez na realizagao do trabalho Segundo Fowler 1992 combina se estas duas ideias na defini o de pot ncia que a taxa de uso da energia ou realizagao de trabalho O simbolo de pot ncia P De acordo com Fowler 1992 na eletricidade o joule usado como unidade base de energia e o segundo como unidade base de tempo Portanto a unidade de pot ncia o joule por segundo J s Ele denominado watt em homenagem ao f sico e inventor escoc s James Watt Para Fowler 1992 a unidade base de pot ncia o watt que igual a 1 J s e cuja abreviatura W Pot ncia P A unidade b sica de pot ncia WATT e igual a tens o aplicada ao circuito multiplicada pela corrente que flui neste circuito Isso representa a raz o em qualquer instante de execu o de trabalho pelo movimento de el trons no cir
29. UNIJUI UNIVERSIDADE REGIONAL DO NOROESTE DO ESTADO DO RIO GRANDE DO SUL DCEEng DEPARTAMENTO DE CIENCIAS EXATAS E ENGENHARIAS ANALISE DE DESEMPENHO E CONSUMO ENERGETICO ENTRE PROCESSADORES ARM E x86 RICARDO KLEIN LORENZONI ljui DEZEMBRO 2011 UNIJUI UNIVERSIDADE REGIONAL DO NOROESTE DO ESTADO DO RIO GRANDE DO SUL DCEEng DEPARTAMENTO DE CI NCIAS EXATAS E ENGENHARIAS ANALISE DE DESEMPENHO E CONSUMO ENERGETICO ENTRE PROCESSADORES ARM E x86 RICARDO KLEIN LORENZONI Trabalho de Conclus o de Curso apresentado ao Curso de Inform tica Sistemas de Informa o do Departamento de Ci ncias Exatas e Engenharias DCEEng da Universidade Regional do Noroeste do Estado do Rio Grande do Sul UNIJUI como requisito para a obten o do t tulo Bacharel em Inform tica Sistemas de Informa o Orientador Prof MSc Edson Luiz Padoin Iju Dezembro 2011 ANALISE DE DESEMPENHO E CONSUMO ENERGETICO ENTRE PROCESSADORES ARM E x86 RICARDO KLEIN LORENZONI Trabalho de Conclus o de Curso apresentado ao Curso de Inform tica Sistemas de Informa o do Departamento de Ci ncias Exatas e Engenharias DCEEng da Universidade Regional do Noroeste do Estado do Rio Grande do Sul UNIJUI como requisito para a obten o do t tulo Bacharel em Inform tica Sistemas de Informa o Orientador Prof MSc Edson Luiz Padoin BANCA EXAMINADORA Prof MSc Rog rio Samuel de Moura Martins Iju Dezembro 2011
30. a o a necessidade de fazer uso destes programas para comparar diferentes sistemas computacionais a fim de verificar a melhor rela o custo benef cio Al m disso extremamente importante nos testes de efici ncia entre hardware compilador Al m de ser uma tima ferramenta para detec o e an lise de gargalos no sistema H uma grande discuss o em torno de concretizar uma padroniza o dos benchmarks e de suas respectivas unidades de medida por m esta uma tarefa dif cil dadas as variadas arquiteturas de computadores dispon veis e a sua velocidade de evolu o Conforme Ida 2000 Apud Berry Cybenko e Larson 1991 dependendo da codifica o do programa os benchmarks podem ser divididos em v rios tipos dentre os principais est o 3 2 1 Sint tico Conforme Ramos 2008 um Benchmark sint tico um programa artificial no z qual o conjunto de opera es que ele executa selecionado para simular uma determinada classe de aplica es O objetivo que sendo o conjunto de instru es o mesmo das aplica es reais o desempenho obtido na execu o ser um bom par metro para a avalia o do desempenho da aplica o real Benchmarks sint ticos s o pequenos programas artificiais que contem uma mistura de afirma es selecionadas de modo que eles representem um grande conjunto de aplica es reais Benchmarks sint ticos normalmente n o executam opera es significativas em um grande conjunto de dado
31. a de potencial chamada tens o A for a que ocasiona o movimento de el trons livres em um condutor formando uma corrente el trica chamada 1 for a eletromotriz fem 2 tens o ou 3 diferen a de potencial Quando existe uma diferen a de potencial entre dois corpos carregados que s o ligados por um condutor os el trons fluir o ao longo do condutor Esse fluxo de el trons se dar do corpo carregado negativamente para o corpo carregado positivamente at que as duas cargas sejam igualadas e que n o mais exista diferen a de potencia MARINHA DOS ESTADOS UNIDOS 1998 O conceito de tens o envolve trabalho que por sua vez envolve for a e dist ncia A unidade SI de trabalho o joule cujo s mbolo J A unidade de for a newton sujo s mbolo N e conforme citado a unidade SI de dist ncia o metro cujo s mbolo m Para se mover um objeto necess rio trabalho para que seja vencida a for a existente em oposi o ao movimento Por exemplo levantar alguma coisas opondo se for a da gravidade requer trabalho De forma gen rica o trabalho requerido em joules o produto da for a em newton pela dist ncia de deslocamento em metros W joules F newtons X s metros Onde W F e s s o s mbolos de trabalho for a e dist ncia respectivamente Energia a capacidade de realizar trabalho Uma de suas formas a energia potencial que a energia que um corpo possui devido a sua posi o O
32. a fazer as medi es 51 Anexo C Utiliza o do Software IntuiLink Data Capture O software IntuiLink Data Capture 3 9 0 esta disponivel para download em http download home agilent com 1A AgilentDataCapture0390 exe authparam 132 3051272 6602175f63a1e33b0a8ecc800dfb6347 Segue descri o passo a passo para utiliza o do software IntuiLink Data Capture utilizado para recuperar os dados capturados pelo oscilosc pio Conecte o cabo USB no oscilosc pio e no computador com o Software IntuiLink Data Capture for Agilent Oscilloscopes v3 90 j instalado assim como a biblioteca Agilent I O Libraries Suite 16 1 que o software necessita Abra o software IntuiLink Data Capture clique no menu Instrument Figura 11 Tela principal do IntuiLink Data Capture 3 90 E Alert Imani Data Capture TT Ble ar yew Instrument Window He AE JE MC Fonte Print da tela principal do software Selecione a Agilent 1000 Series Na nova janela na aba Set I O Clique no botao Find Intrument O programa ira reconhecer o eguipamento gue esta conectado via usb selecione a op o e de dois cliques nela o equipamento ira aparecer no campo Indintified instruments on my computer selecione ele e clique em ok Desta forma voc j selecionou o equipamento do qual ira recuperar os dados Va para a aba Get Waveform Data e certifique se de fazer as altera es para que fique conforme a imagem abaixo 52 Figura 12 Tela de
33. a_resultado tempoFinal mili segundos argv 0 MSGLOG void multiplica int i v printf n multiplicando n for i 0 i lt L i for j 0 j lt C j for v 0 v lt C v m3 i j m3 i j m1 ily m2 v I j 72 73 void mostra_matriz int z v printf n MATRIZ printf n M 1 n for z 0 z lt L z for v 0 v lt C v printf 3d m1 z V printf n printf n n n printf n M 2 n for z 0 z lt L z for v 0 v lt C v printf 3d m2 z V printf n void mostra_resultado int z v printf n MATRIZ RESULTADO n for 0 z lt L z 4 for v 0 v lt C printf 4d m3 z v j printf n printf n n n void inicializa matriz int z v printf n inicializando matrizes n for z 0 z lt L z for v 0 v lt C v m1 z v 2 1 m2 z v m3 z v 0 Anexol Algoritmo mult thread c Algoritmo de multiplicagao de matrizes com execugao em threads include lt stdio h gt include lt pthread h gt include tempo h define L 1000 define C 1000 int m1 C L m2 C L m3 C IL void inicializa_matriz void mostra_matriz void multiplica void arg void mostra resultado int main int argc char argv pthread_t 11 t2 int x y inicializa_matriz mostra matriz te
34. cada processador podendo assim processar um maior n mero de informa es com uma mesma quantidade de energia fazendo um consumo mais eficiente da mesma Com a grande difus o dos sistemas embarcados e da computa o m vel a microarquitetura ARM se tornou mais conhecida 10 Os processadores ARM Advanced RISC Machine sao desenvolvido pela ARM Holdings com o proposito de ter um baixo consumo de energia e obtendo o melhor desempenho possivel com ela Os processadores dessa arguitetura seguem a risca algumas propostas b sicas sao elas ter um pequeno conjunto de instru es ser pequenos ocupar pouco espa o e consumir pouca energia Com a crescente busca da popula o por produtos e servi os ecologicamente corretos ou com tecnologias limpas n o poluentes as ind strias e organiza es perceberam a um grande nicho de mercado e passaram a investir nessa rea por esse investimento se tornar um grande diferencial competitivo para elas Existem no mercado alguns produtos na rea da tecnologia que possuem processadores ARM que poderiam ser utilizados pelos consumidores de diversas formas dentre elas como computadores pois os processadores ARM j possuem suporte oferecido por diversos sistemas operacionais Neste trabalho pretende se conhecer melhor a arquitetura x86 utilizada em desktops notebooks servidores clusters e supercomputadores e a arquitetura ARM presente na maioria dos celulares e sistemas embarcados do mund
35. cas ou privadas grande parte dos computadores que s o utilizados possui processadores que fazem um alto consumo de energia mesmo em momentos em que n o est o sendo utilizados As ideologias de ecologicamente correto e crescimento sustent vel se tornam cada vez mais presentes em nosso cotidiano e v m cada vez mais influenciando nas escolhas das pessoas entre um fornecedor ou outro um fabricante ou outro ou seja cada vez mais noticiar e fazer campanhas publicit rias divulgando que a marca institui o faz um trabalho em busca de um crescimento sustent vel ou ecologicamente correto vai se tornar um diferencial competitivo entre as empresas e organiza es Um dos assuntos que mais cresce em todos os sentidos no mundo hoje a economia de energia principalmente em notebooks netbooks celulares tablets e PDA s que utilizam baterias e necessitam de um controle mais rigoroso do consumo de energia e a utiliza o consciente dos recursos naturais Como o assunto n o mais somente o tempo de dura o da carga mas um consumo mais eficiente da energia dispon vel evitando o desperd cio esse assunto deixa de estar somente voltado a dispositivos m veis e sistemas embarcados e passa a ser tamb m uma necessidade a se avaliar em desktops mainframes e servidores Para buscar o melhor desempenho considerando n o s o tempo de resposta para uma solicita o mas obter um tempo de resposta aceit vel para a mesma
36. configuragao para recuperar os dados do osciloscopio Agilent 1000 Series Add In E Get Waveform Data Save Recall Measurement Set 140 Acquistions Get Screen Image a ie mili fe Use Current Acquisition Make New Acauisition jw Get Waveform Data Waveform Selection Scope Z Channel C Screen Data up to 600 points v Channel 2 Raw Data up to 20k points Number of Points 20k c Actual number of data points returned may be less than the number of points selected If MATH function is enabled ensure that the source channels are displayed as well r Fonte Print do software em execu o Ao concluir a configurac o nesta aba aperte o botao run stop no oscilosc pio antes de iniciar a execugao do algoritmo e ao termino do mesmo aperte novamente o botao para pausar a coleta de dados Certifique se de que todo o intervalo de coleta dos dados esteja vis vel na tela do oscilosc pio pois devido ao tamanho da mem ria do mesmo as informag es do inicio da coleta ser o sobrescrevidas caso o gr fico ultrapasse o fim da tela Ent o basta clicar em Ok ainda na janela de configuragao para que o software recupere os dados fornecidos pelo oscilosc pio Esta configuragao dever ser executada toda vez que o software for iniciado Ap s a primeira configura o basta clicar no bot o Get Data identificado pelo desenho de um oscilosc pio e localizado na barra de ferramentas da
37. cuito O s mbolo P indica pot ncia el trica Assim a f rmula de pot ncia E a tens o e a corrente que flui no resistor ou no circuito cuja pot ncia est sendo medida A quantidade de pot ncia mudar quando a tens o a corrente ou ambos mudarem MARINHA DO ESTADOS UNIDOS 1998 A raz o na qual algum corpo absorve ou produz energia a pot ncia absorvida ou produzida por este corpo Uma fonte de energia produz ou desenvolve energia e uma carga absorve energia A unidade SI da pot ncia o watt cujo s mbolo W O s mbolo de pot ncia P para pot ncias constantes e p para pot ncias vari veis no tempo Se 1 J de trabalho absorvido ou liberado numa taxa constante de 1 s a pot ncia correspondente 1W O MALLEY 1993 CALCULO DE POT NCIA A pot ncia igual corrente vezes tens o Expresso como uma f rmula tem se Pot ncia P corrente I X tens o V Ou A pot ncia est na sua unidade base quando a tens o dada em volts e a corrente em amp res FOWLER 1992 27 4 1 4 Energia Consumida consumo A energia el trica consumida ou produzida o produto da corrente el trica de entrada ou sa da e o tempo durante o qual essa entrada ou sa da ocorre W joules P watts X t segundos Energia el trica aquilo que os consumidores compram das companhias el tricas Essas companhias n o usam o joule como unidade de energia A unidade utilizada o quilowatt
38. cutando de forma sequencial e com 2 duas threads sem otimiza o com otimiza o O1 e O2 respectivamente Tabela 2 Consumo m dio na execu o do algoritmo x86 e ARM Consumo m dio na execu o Wh x86 ARM x86 ARM Sequencial Otimiza o O 0 93632 0 0083 0 11130 0 0071 8 41 Otimiza o O1 0 69942 0 0056 0 06250 0 0029 11 19 Otimiza o O2 0 69595 0 0081 0 06217 0 0045 11 19 Threads Otimizagao O 0 87679 0 0397 0 09476 0 0022 9 25 Otimizagao O1 0 66870 0 0413 0 05622 0 0022 11 89 Otimiza o O2 0 68256 0 0084 0 05498 0 0009 12 41 Na tabela 3 est o descritos os tempos m dios de execu o do algoritmo executando de forma sequencial e com 2 duas threads sem otimiza o e com otimiza o O1 e 2 respectivamente Tabela 3 Tempo m dio de execu o do algoritmo x86 e ARM Tempo m dio de execu o s x86 ARM x86 ARM Sequencial Otimiza o O 16 23 0 083 318 97 4 784 19 65 Otimiza o O1 10 46 0 020 182 96 9 961 17 49 Otimiza o O2 10 33 0 013 180 79 13 435 17 50 Threads Otimiza o O 12 84 0 039 277 49 6 668 21 61 Otimiza o O1 9 11 0 010 166 25 t 6 558 18 25 Otimizac o O2 9 10 0 009 160 26 3 136 17 61 40 Ao analisando as duas tabelas acima pode se verificar gue executando o algoritmo sequencial sem otimiza o o processador da arquitetura x86 consumiu 8 41 vezes mais energia do que o processador ARM mas em contrapar
39. de execu o Ao se utilizar t cnicas de processamento paralelo com a mesma flag de compila o O utilizada como padr o do consumo percebe se uma redu o de quase 15 no consumo em compara o a execu o em sequencial e uma redu o de tempo de 13 Ao utilizarem se as flags de otimiza o O1 e O2 estes resultados ficam ainda melhores chegando a reduzir o consumo entre 49 49 e 41 50 60 e o tempo de execu o reduzido a 47 88 com a flag O1 e 49 76 com a flag O2 A tabela 5 demonstra em percentagem a redu o em consumo e em tempo da arquitetura x86 quando o algoritmo foi recompilado utilizando as flags de otimiza o O1 e O2 em sequencial e O1 e 2 executando em paralelo comparando se com a execu o sequencial com a otimiza o padr o do GCC Tabela 5 redu o de consumo e tempo de execu o utilizando otimiza es na Arquitetura x86 Consumo Wh Tempo s redu o do redu o consumo no tempo x86 Seguencial O 0 9363222 16 23 100 00 100 00 O1 0 6994215 10 46 25 30 35 55 O2 0 6959479 10 32 25 67 36 41 Thread O 0 8767932 12 84 6 36 20 89 O1 0 6687007 9 11 28 5876 43 87 2 0 6825618 9 10 27 10 43 93 Pode se observar na tabela 5 que as otimiza es realizadas pelo GCC na arquitetura x86 nao alcanga resultados tao significativos quanto alcangou na arquitetura arm Mas ainda assim importante destacar os resultados obtidos com esta melhoria Ao reco
40. dor Intel Pentium IV denominado como x86 que tem como prioridade o alto desempenho O outro uma placa Beagleboard rev C3 da Texas Instrumens que simula um dispositivo m vel com a maioria das tecnologias j embutidas entre elas o processador memoria RAM portas para perif ricos USB USB OTG SD uma porta DVI D uma porta S V deo uma porta de sa da de udio stereo uma entrada de udio uma porta serial e a entrada da alimenta o Esta placa simula um computador completo com o benef cio de ser pequena consumir pouca energia e n o fazer nenhum barulho O primeiro conjunto de testes foi realizado utilizando uma BeagleBoard que um sistema desenvolvido pela Texas Instruments com o objetivo de demonstrar o 32 uso do processador OMAP 3530 arquitetura ARM Inicialmente foi realizada uma medi o deste sistema em estado ocioso para obter um valor m dio referente ao seu consumo Posteriormente foram executados os testes para medir o desempenho do eguipamento e o consumo de energia do eguipamento durante a execugao dos mesmos A execu o do benchmark HPL ocorreu de forma diferenciada onde primeiramente foram realizadas diversas execu es diferentes do algoritmo no equipamento para obter se o melhor resultado poss vel ao encontrar tal resultado foi realizada mais uma execu o de tal teste enquanto se media o consumo do equipamento Para as medi es de consumo com a Beagleboard foi usado um Oscilosc pio Agilent T
41. e c lculos cient ficos J que dispositivos de computa o t m enorme capacidade de processamento conv m utilizar unidades maiores que FLOPS seus m ltiplos Os m ltiplos mais utilizados s o megaflops MFLOPS gigaflops GFLOPS teraflops TFLOPS petaflops PFLOPS e exaflops EFLOPS FLOPS 2011 3 2 Benchmarks Benchmarks s o programas utilizados para avaliar sistematicamente algum aspecto do desempenho de um computador com o objetivo de encontrar gargalos no sistema ou para comparar o desempenho de duas ou mais m quinas diferentes Quando utilizado para comparar o desempenho de m quinas a m trica de desempenho mais confi vel o tempo de execu o total para executar o benchmark LILJA 2000 Um benchmark um programa de teste de performance que visa adquirir caracter sticas de processamento e movimenta o de dados de um grupo 20 de aplica es Programas de benchmark s o usados para medir e prever a performance de um sistema e revelar seu comportamento bem como revelar seus pontos fortes e fracos Ainda definimos uma suite de benchmark como um grupo de programas de benchmark juntamente com um conjunto de regras para governar condi es e procedimentos de teste incluindo a plataforma do ambiente entrada e sa da de dados e medidas de performance OBAIDAT e BOUDRIGA 2010 Conforme Ida 2000 Benchmarks s o programas que t m por finalidade medir a performance dos componentes de sistemas de comput
42. e clusters O Linpack o principal fator de avalia o para compor a lista dos 500 computadores mais r pidos do mundo o Top500 O desempenho do HPL fortemente dependente da biblioteca BLAS existindo v rias vers es que podem ser utilizadas A fatora o do benchmark HPL requer 2 3 N opera es e cada duas solu es triangulares totalizam N opera es cada todas de ponto flutuante A medida que N aumenta a fase de fatora o domina o tempo de computa o Os dados relacionados com a i sima itera o do algoritmo s o apresentados na Figura 4 D o i simo bloco na diagonal principal L U e T s o as partes atuais da matriz inferior superior e restante O valor de N determinado pela quantidade m xima de mem ria que cada n computacional pode destinar para o processo HPL antes que comecem a acontecer opera es de swap para o disco Isso significa que o sistema operacional precisa ser minimizado para permitir mais espago para a execuc o do HPL Assim sendo a imagem do sistema operacional para rodar os testes HPL nao deve ser a mesma que a da fase de produc o do cluster Assumindo que o tamanho da matriz A 8 N bytes ent o se em cada computacional deixarmos mais ou menos 20 da mem ria para o sistema N pode ser escolhido com a seguinte f rmula 11 N 0 8 X NumNos X MemNo 8 1 Onde Num Nos o n mero total de n s e Mem No a capacidade de mem ria de cada n do cluster Se N
43. echnologies DSO1002A equipado com uma ponta de prova Agilent Technologies 1146A para coleta da corrente e com uma outra ponta de prova LF 20A para coleta da tens o Com ambas as informa es sendo recuperadas do oscilosc pio atrav s da conex o USB do mesmo utilizando o software IntuiLink Data Capture for Agilent Osciloscopes v3 90 Figura 7 Esquema de liga o dos equipamentos ARM Corrente A Os testes realizados com a CPU desktop Leader tech foram procedidos da mesma forma que os testes realizados com a BeagleBoard onde inicialmente se adquiriu informa es com rela o ao consumo do equipamento em estado ocioso em seguida foram executados os programas repetidas vezes para se obter um valor m dio de consumo de energia durante a execu o dos mesmos e o tempo m dio de execu o do programa com cada uma das otimiza es J para a execu o do HPL foram realizadas v rias modifica es no arquivo HPL dat para tornar o 33 benchmark o mais ajustado possivel a arguitetura do eguipamento medido quando se obteve o melhor resultado foi realizado novamente a execugao do algoritmo e ao mesmo tempo foi mensurado o consumo de energia do eguipamento para executar tal programa As medi es de consumo do CPU foram realizadas atrav s da Plataforma BMI Dranetz PP4300 equipada com uma ponta de prova de corrente TR2510 e duas ponteiras para a medi o da tens o que eram ligadas na mesma r gua que a CPU e ligadas nos po
44. entido A raz o dessa corrente unidirecional se deve ao fato das fontes de tens o como as pilhas e as baterias manterem a mesma polaridade de tens o de sa da A tens o fornecida por essas fontes chamada de tens o de corrente cont nua ou simplesmente de tens o dc ou tens o cc Uma fonte de tens o cont nua pode variar o valor da usa tens o de sa da mas se a polaridade for mantida a corrente fluir somente num sentido GUSSOW 1996 Para Roditi 2005 a corrente el trica que flui numa nica dire o e com magnitude praticamente constante s mbolo cc ou DC 25 4 1 2 Tens o A tens o a press o el trica que causa a circula o de corrente A tens o tamb m conhecida como for a eletromotriz fem ou diferen a de potencial Todos estes termos se referem for a que coloca cargas em movimento A diferen a de potencial o termo que melhor descreve o fen meno porque uma tens o uma diferen a de energia potencial que existe entre dois pontos O s mbolo da tens o V volt FOWLER 1992 Segundo Fowler 1992 a unidade base de tens o o joule por coulomb Um joule por coulomb igual a um volt O volt a unidade base de tens o A abreviatura V De acordo com Gussow 1996 a unidade fundamental de diferen a de potencial o volt V O s mbolo usado para a diferen a de potencial V que indica a capacidade de realizar trabalho ao se for ar os el trons a se deslocarem A diferen
45. es necess rios para a conclus o do trabalho MUITO OBRIGADO RESUMO Dentre as boas praticas da TI VERDE uma das mais abordadas na atualidade e o consumo eficiente de energia eletrica Atualmente grande parte dos usuarios domesticos tem por costume deixar seus computadores ligados varias horas por dia muitas vezes sem executar nenhum programa ou usando algum software de download Grande parte das maguinas desses usuarios sao equipamentos mais antigos ou maguinas destinadas a fornecer um grande desempenho nestas m quinas o consumo eficiente n o uma prioridade A partir desse conhecimento este trabalho visa medir o desempenho computacional e o consumo de energia de processadores da arquitetura ARM e de um processador mais antigo da arquitetura x86 com o intuito de avaliar a possibilidade de substituir estas m quinas subutilizadas por m quinas mais econ micas e capazes de realizar o mesmo trabalho proporcionando uma grande economia de energia Palavras chave TI Verde Desempenho de processadores ARM x86 MFLOPS MFLOPS WATT ABSTRACT Among the best practices of GREEN IT one of the most discussed today is the efficient use of electricity Currently most home users are customary to leave their computers powered on for several hours a day often without running any programs or by using any download software Most of these machines are older eguipment or machines designed to deliver a great performance In these machines the e
46. f Math channels ITrans ODE Current Transient value Appearance PKKW Active power P W Harmonics SKVAA JO Apparent power S VA QKVAR I EI 7 Reactive power O VAR PF MOD Power Factor PF Freg E Frequency Vunb DevAvg Voltage Imbalance by max deviation from av VThd 3 E o THD Fund normalized VTHDRss Voltage THD unnormalized Root Sum Squar IThd THD Fund nomalized ITHDRss IE Current THD unnormalized Root Sum Square ICF Hoa Current Crest factor KFact E Transformer K Factor Demand kWh h _ V Real Power Demand Pintg Energy kWh lv 1 1 1 E Energy Integrated Active Power W Hrs 4 m Cancel Help A bs Fonte print do software em execu o Na sequencia basta ir no menu FILE op o Save AS e salvar o arquivo no local desejado com o formato TXT exemplo de um arquivo gerado no anexo X Ap s o arquivo TXT salvo efetuamos a importa o do mesmo com o Microsoft Excel convertendo o mesmo em tabela e realizando os c lculos apresentados no estudo de caso HPL 70 Anexo F HPL dat Abaixo o arquivo HPL dat utilizado para configurar a execugao do Linpack HPLinpack benchmark input file Innovative Computing Laboratory University of Tennessee HPL out output file name if any 6 device out 6 stdout 7 stderr file 1 of problems sizes N 5800 Ns 1 of NBs 592 NBs 0 PMAP process mapping 0 Row 1 Column major 1 o
47. f process grids P x Q 1 Ps 1 Qs 16 0 threshold 1 of panel fact 012 PFACTs 0 left 1 Crout 2 Right 1 of recursive stopping criterium 24 NBMINs gt 1 1 of panels in recursion 2 NDIVs 1 of recursive panel fact 012 RFACTs 0 left 1 Crout 2 Right 1 of broadcast 0 BCASTs 0 1rg 1 1rM 2 2rg 3 2rM 4 Lng 5 LnM 1 of lookahead depth 0 DEPTHs gt 0 2 SWAP 0 bin exch 1 long 2 mix 64 swapping threshold 0 L1 in O transposed 1 no transposed form 0 U in O transposed 1 no transposed form 1 Equilibration O no 1 yes 8 memory alignment in double gt 0 71 Anexo G Melhor resultado HPL no processador x86 Este arquivo foi gerado pelo HPL demonstrando as configura es recebidas atrav s do arquivo HPL dat e o resultado alcan ado pela execu o do benchmark HPLinpack 2 0 High Performance Linpack benchmark September 10 2008 Written by A Petitet and R Clint Whaley Innovative Computing Laboratory UTK Modified by Piotr Luszczek Innovative Computing Laboratory UTK Modified by Julien Langou University of Colorado Denver An explanation of the input output parameters follows T V Wall time encoded variant N The order of the coefficient matrix A NB The partitioning blocking factor P The number of process rows Q The number of process columns Time Time in seconds to solve the linear system Gflops Rate of execution for
48. fazendo um consumo eficiente da energia as fabricantes de microprocessadores passaram a investir em pesquisas para melhorar a efici ncia energ tica de seu 12 hardware buscando afetar de forma minima ou ate melhorar o desempenho de seus eguipamentos A Intel nos ltimos anos lan ou os seus processadores aumentando a quantidade de n cleos de processamento reduzindo ou mantendo o clock para melhorar a efici ncia dos mesmos sem aumentar a dissipa o de calor Ap s essa etapa buscou melhorar a arquitetura interna de seus processadores diminuindo o tamanho dos transistores e trocando o material dos mesmos que antes eram de Sil cio para H fnio um material menos t xico que conduz melhor a energia e que dissipa menos calor Nos ltimos modelos de processadores foram in meras as melhorias implementadas em n vel de Hardware redu o do tamanho dos transistores troca da mat ria prima dos transistores e Software gerenciamento din mico dos cores threads cache e energia adi o de novas instru es SSE4 Multi Threading simult neo sobre os seus processadores na inten o de melhorar o desempenho do equipamento consumir menos energia e utiliz la de forma mais eficiente INTEL 2011 Com a constante evolu o proporcionada pelas ind strias de microprocessadores o desenvolvedor de software tem de se atualizar constantemente para ficar a par das especifica es desses novos produtos que v m chegando ao mercado
49. ficar o desempenho dos processadores por meio de benchmarks 15 2 ESTADO DA ARTE Inicialmente pretende se abordar um pouco as arguiteturas x86 e ARM apresentando algumas diferengas entre elas em seguida apresentar a metrica de medida de desempenho de computadores MFLOPS e ao final definir o conceito de benchmark e apresentar alguns dos diferentes tipos de classificagao de benchmark definindo o conceito de cada um 2 1 Arguiteturas x86 e ARM Este subcapitulo tem por objetivo apresentar as caracteristicas principais das arquiteturas x86 e ARM com rela o ao conjunto de instru es e caracter sticas pr prias das mesmas Uma das principais particularidades de ambas as arquiteturas que s o superes calares Um processador superes calar aquele no qual s o usadas v rias pipelines de instru o independentes Cada pipeline tem diversos est gios podendo manipular v rias instru es a cada instante O uso de v rias pipelines introduz um novo n vel de paralelismo possibilitando processar diversos fluxos de instru o de cada vez Um processador superes calar explora o que conhecido como paralelismo no n vel de instru es que diz respeito ao n vel em que instru es de um programa podem ser executadas em paralelo STALLINGS 2002 2 1 1 Arquitetura x86 Segundo Torres e Lima 2006 os processadores da arquitetura x86 utilizam uma arquitetura h brida CISC RISC A solu o implantada hoje por todos os
50. logistas mas tamb m com o apoio de profissionais de todas as reas bem como da popula o em geral Na rea de Tl o assunto abordado com tentativas de reduzir a cria o de lixo tecnol gico causada pela r pida evolu o dos dispositivos e tamb m com tentativas de reduzir o consumo de energia dos equipamentos At alguns anos atr s as ind strias competiam entre si em busca de criar processadores cada vez mais r pidos Para vencer essa competi o elas aumentavam a frequ ncia de trabalho de seus produtos at que chegaram aos limites que os processadores suportavam sem superaquecer e consequentemente derreter ou autodesligar Esse limite pode ser ampliado atrav s do uso de coolers mais robustos e maiores com a finalidade nica de resfriar o processador Neste ponto as ind strias notaram que o custo de aumentar ainda mais a frequ ncia de clock dos processadores iria se tornar alto demais visto o grande desperd cio de energia t rmica nas m quinas Al m da grande quantidade de energia desperdi ada pelo processador em forma de energia t rmica calor seria necess rio utilizar coolers ainda maiores e mais robustos para manter essas m quinas resfriadas e funcionando Para solucionar esse problema as ind strias optaram por reduzir a frequ ncia de seus equipamentos reduzindo a dissipa o de energia t rmica e aumentar a sua capacidade de processamento Fizeram isso aumentando o n mero de n cleos presentes dentro de
51. los positivo e negativo do canal A do Dranetz Os dados adquiridos pelo Dranetz foram recuperados atrav s do cart o de mem ria flash contido no equipamento e armazenados em um laptop Para manipular os dados recuperados do Dranetz utilizou se o software Dran View Enterprise 6 11 02 software propriet rio desenvolvido pela pr pria fabricante do aparelho e nica forma de visualizar os dados adquiridos pelo mesmo Figura 8 Esquema de liga o dos equipamentos CPU CORRENTE A Alimenta o Dranetz 5 1 Descri o dos Equipamentos Abaixo configura es especificas dos equipamentos medidos apresentando especifica es como o processador utilizado o sistema operacional que foi instalado nas m quinas e o compilador utilizado para compilar os programas executados 34 5 1 1 ACPU A CPU Leader Tech um computador pessoal desktop desenvolvido com o objetivo de obter o melhor desempenho possivel A CPU possui internamente ligados a fonte a placa mae o processador uma placa de video um drive de CD um drive de disguete e um disco rigido A CPU possui um processador Intel Pentium IV 3 01 GHz com tecnologia de HT Hyper Threading com conjunto de instru es 32 bits FSB 800MHz Memoria cache L1 de 32 bits de instru es e 32 bits de cache e cache L2 de 1024KB A memoria RAM s o dois pentes de mem ria DDR com frequ ncia de 333MHz O computador e alimentado por uma fonte iMBP 400W modelo KYP 280ATXN com uma
52. mente um RISC Reduced Instruction Set Computer Algumas caracter sticas interessantes das instru es ARM Conjunto grande e uniforme de registradores Arquitetura de LOAD STORE Opera es de processamento de dados n o operam diretamente com o conte do da mem ria somente com o conte do de registradores Modos de endere amento simples com todos endere os de load store sendo determinados a partir dos registradores ou pelos campos da instru o Uniformidade e tamanho fixo dos campos das instru es para simplificar a decodifica o de instru es Controle sobre a ALU e sobre o shifter deslocador em todas instru es de processamento de dados Auto incremento e decremento dos endere os das instru es Instru es de m ltiplos loads stores para maximizar a performance Execu o condicional da maioria das instru es GOMES LEITE e CAETANO 2011 Possui conjunto de instru es de tamanho fixo e segundo Carter 2003 Codifica es de conjuntos de intru es de tamanho fixo utilizam o mesmo n mero de bits para codificar cada instru o Codifica es de comprimento fixo t m a vantagem por serem simples de decodificar reduzindo a quantidade de l gica e lat ncia da l gica de decodifica o Al m disso um processador que utilize codifica o de comprimento fixo para o seu conjunto de instru es pode facilmente prever a localiza o da pr xima instru o a ser executada assumindo que a instru
53. miza es default O O1 e O2 Conforme Free Software Foundation Inc 2011 e default O com esta flag o gcc apenas compila o c digo n o gerando nenhum tipo de otimiza o e O1 com esta flag o gcc leva um pouco mais de tempo para compilar otimizando um pouco a execu o do programa O2 com esta flag o gcc executa quase todas as otimiza es suportadas que n o envolvem um compromisso entre espa o e velocidade Utilizando se O2 comparado com a flag default o gcc aumenta tanto o tempo necess rio para a compila o do c digo quanto o desempenho do c digo gerado Os algoritmos utilizados podem ser vistos no Anexo H e Anexo juntamente com a biblioteca criada para cronometrar o tempo de execu o dos mesmos no Anexo J 5 3 Linpack HPL Inicialmente o HPL era um conjunto de rotinas em Fortran usado como benchmark para supercomputadores criados no in cio dos anos 80 Criado por Jack Dongarra o teste era simplesmente a resolu o de matrizes lineares 100X100 Este teste se tornou invi vel assim que a matriz passou a caber na cache de um microprocessador 37 Como a primeira implementa o do benchmark se tornou invi vel foi desenvolvida uma nova vers o onde o tamanho da matriz pode ser definido pelo usu rio Atualmente a implementa o port vel do Linpack passou a se chamar High Performance Linpack sendo a principal ferramenta de avalia o de performance em supercomputadores inclusiv
54. mpilar o algoritmo de execu o sequencial com as flags O1 e O2 obteve se uma redu o de 25 3 a 25 67 no consumo e de 35 55 e 36 4196 no tempo de execu o quando comparados com a execu o sequencial com otimizagao O Ao utilizar se tecnicas de processamento paralelo a flag O do algoritmo em thread reduz o consumo em 6 36 e o tempo de execu o em 20 89 em compara o a execu o sequencial com a mesma flag J as execu es com as otimiza o O1 e O2 reduziram o consumo em 28 58 e 27 10 e o tempo de execu o em 43 87 e 43 93 respectivamente Comparando as tabelas 4 e 5 pode se observar que as redu es de tempo de execu o obtidas ao se utilizar as flags de otimiza o e t cnicas de processamento paralelo foram muito parecidas alcan ando quase 50 de melhora na arquitetura ARM e cerca de 44 na arquitetura x86 J ao comparar a redu o no consumo de energia percebe se que as arquiteturas apresentaram resultados 42 bem diferentes Enguanto na arguitetura ARM o consumo de energia reduziu na mesma propor o que o tempo de execu o na arquitetura x86 esse redu o foi muito menor n o passando de 28 58 de redu o no consumo enquanto a redu o no tempo de execu o chegou a quase 44 Na tabela 6 s o apresentados os melhores resultados obtidos na execu o do Benchmark HPL presente no pacote do Linpack a m dia do consumo durante a execu o do mesmo e o resultado da divis o
55. mpo x 0 pthread_create amp t1 NULL multiplica void amp x y C 2 pthread_create amp t2 NULL multiplica void amp y pthread join t1 NULL pthread join t2 NULL tempo2 mostra resultado tempoFinal mili segundos argv 0 MSGLOG pthread exit NULL 74 75 void multiplica void arg int pos int arg int i j v printf n multiplicando n for i pos i lt p0S C 2 i for j 0 j lt C j for v 0 v lt C v m3 i j m3 i j m1 i lv m2 v I j return NULL j void mostra matriz int z v printf n MATRIZW printf n M 1 M for 0 z lt L z for v 0 v lt C v printf 3d m1 z V printf n printf n n n printf n M 2 M for 0 z lt L z for v 0 v lt C v printf 3d m2 z V printf n void mostra_resultado int z v printf n MATRIZ RESULTADO w for z 0 z lt L z for v0 v lt C v printf 4d m3 z V printf n printf n n n void inicializa matriz int z v printf n inicializando matrizes n for z 0 z lt L z for v 0 v lt C v m1 z v 2 1 m2 z v m3 z v 0 76 77 Anexo J Biblioteca tempo h Biblioteca utilizada na execu o dos algoritmos para obter o tempo de execu o dos mesmos durante os testes include lt
56. ncedida aos fabricantes gera uma disputa saudavel entre os mesmos por um melhor desempenho e consumo de energia o que contribui para o avan o da tecnologia Conforme Maluta 2008 ao comparar a execu o de um algoritmo de simples ordena o em processadores das duas arquiteturas notou se que a velocidade de execu o nos processadores proporcional a sua efici ncia Portanto a inten o deste trabalho buscar o conhecimento acerca das arquiteturas x86 e ARM e a partir desse conhecimento selecionar um sistema completo gabinete que utilize um processador x86 e um sistema completo com processador ARM Ap s escolher esses equipamentos ser feito um conjunto de testes com os dois a fim de definir o consumo m dio destes em estado ocioso e depois outros conjuntos de testes para definir o desempenho de processamento dos dois equipamentos juntamente com o consumo de energia realizado pelos mesmos durante a execu o desses testes para ent o poder definir se um processador da arquitetura ARM pode substituir processadores x86 em computadores de uso pessoal 1 4 Objetivo 1 4 1 Objetivo geral e Analisar o consumo de energia de dispositivos e correlacionar o consumo de energia com a quantifica o de seu desempenho e apresentar os resultados indicando qual tem um melhor desempenho Watt consumido 14 1 4 2 Objetivos especificos e Medir o consumo de energia de dispositivos das arguiteturas x86 e ARM Quanti
57. nergy efficiency is not a priority From this knowledge this study aims to measure the computational performance and power consumption of the ARM architecture processors and an older x86 architecture processor in order to evaluate the possibility of replacing these machines underutilized by less expensive and capable machines performing the same job providing great energy savings Keywords Green Tl Processor Performance ARM x86 MFLOPS MFLOPS WATT SUMARIO eee a 9 1 1 10 1 2 HIP TESES aa beat 11 S I A PA eek eat ae 11 124 ODETI a SS eel e e 13 t4 Aes Objetivo Geral ee tes aaa ke veki 13 1 4 2 Objetivos espec ficos serrana 14 2 ESTADO DA ARTE ai nani nea cioe Miers don A Hte tin MO beni da 15 2 1 Arquiteturas x86 e ARM ot iE opti idee 15 2453 Arg itet ra a a 15 2 1 2 Arquitetura ARA t stad tad tot 17 3 MENSURA O DO 19 3 1 MFLOPS Milh es de Instru es de Ponto Flutuante por Segundo 19 3 2 Benchmarks carte seid ted Osea ed a aa 19 98 15 O EEA M 20 9 0 2 Kettiol 5o ei 21 9 23 35 VAGONI NO seta canes ses cane ered ads ee Sue 21 3 2 4 Aplica o 21 4 MENSURA O DO
58. o Ap s isso pretende se rodar nesses equipamentos alguns programas de benchmark enquanto mensurado o consumo de energia dos mesmos para poder ent o compar los com rela o a consumo e desempenho 1 1 Problema Uma parcela dos usu rios de sistemas computacionais tem o h bito de deixar os seus computadores ligados 24 horas por dia Na grande maioria das vezes esses equipamentos ficam ligados sem realizar nenhum tipo de tarefa ou ent o est o realizando tarefas que n o exigem grande capacidade de processamento tais como realizar downloads ou atuar como um simples servidor de arquivos dom stico Computadores mais antigos eram desenvolvidos pelos fabricantes dando nfase em desempenho sem se preocupar com o consumo de energia gerado pelos mesmos Um grande desafio hoje para a sociedade realizar um consumo mais eficiente e consciente da energia el trica dessa forma torna se necess rio apresentar aos usu rios e sociedade novas op es no que diz respeito a sistemas de computa o com baixo consumo de energia e que supram as suas necessidades 11 1 2 Hipoteses Seriam os processadores ARM econ micos e com um desempenho computacional suficientemente elevado para serem utilizados como uma alternativa em dispositivos m veis e at mesmo em computadores para substituir os processadores de usu rios que necessitam de equipamentos com grande poder de processamento 1 3 Justificativa Em muitas empresas p bli
59. ona um oscilosc pio 2007 Dispon vel em lt http www notapositiva com pt trbestbs fisica 1 1osciloscopio htm gt Acessado em nov 2011 SILVA Vin cius BENTES Cristiana GUEDES S rgio SILVA Gabriel P Arquitetura e avalia o do cluster de alto desempenho Netuno In WSCAD SSC 2009 X Simp sio em Sistemas Computacionais 2009 S o Paulo P 52 59 STALLINGS William Arquitetura e organiza o de computadores Projeto para o Desempenho S o Paulo ABDR 2002 TORRES G LIMA C Por dentro da arquitetura do Pentium 4 Dispon vel em lt http www clubedohardware com br artigos Por Dentro da Arquitetura do Pentium 4 1201 4 gt Acessado em nov 2011 TSUKAMOTO Steven K Arquitetura dos supercomputadores TOP500 2010 16 f Monografia Gradua o em Ci ncias da Computa o Universidade de S o Paulo S o Paulo 2010 UBUNTUWIKI Ubuntu 11 04 Natty Narwhal Disponivel lt http cdimage ubuntu com releases 1 1 04 release Acessado em nov 2011 47 em 48 ANEXOS Anexo A Configura o Oscilosc pio A configura o do oscilosc pio foi realizada conforme manual do usu rio dispon vel em lt http cp literature agilent com litweb pdf 54130 97014 pdf gt Segue abaixo manual de configuragao do osciloscopio utilizado no trabalho Ligar o Osciloscopio Colocar a ponta de prova de corrente Agilent 1146A AC DC current probe no canal 1 Ligar a Ponta de Prova em 100mV A Apertar o b
60. otao 1 apertar em acoplamento Selecionar o tipo de acoplamento DC E apertar botao push to select Apertar em Ponta Prova Selecionar Ponta Prova 1X E apertar botao push to select Apertar no bot o 1 2 e com uma flecha para baixo Apertar em unidade Selecionar a unidade A corrente Apertar o bot o push to select Apertar o bot o measure Apertar o bot o fonte at que o valor abaixo de fonte seja CH1 Apertar o bot o limpar Apertar o bot o tens o Selecionar a op o Vrms e apertar o bot o push to select Inserir a ponta de prova de tens o Ponta de Prova de Oscilosc pio LF 20A no canal 2 Apertar o bot o 2 apertar em acoplamento Selecionar o tipo de acoplamento DC E apertar bot o push to select 49 Selecionar Ponta Prova 1X E apertar botao push to select Apertar no bot o 1 2 e com uma flecha para baixo Apertar em unidade Selecionar a unidade V tens o Apertar o bot o push to select Apertar o bot o measure Apertar o bot o fonte at que o valor abaixo de fonte seja CH2 Apertar o bot o limpar Apertar o bot o tens o Selecionar a op o Vrms e apertar o bot o push to select Pronto o oscilosc pio est pronto para exibir os valores de Corrente e Tens o a partir dos canais 1 e 2 respectivamente 50 Anexo B Calibrando a Ponta de Prova 1146A Configura o Da ponta de prova 1146A para o oscilosc pio Agilent DSO1002A Aparelho Utilizado para a Configu
61. principal das configura es O ultimo ajuste necessario esta no intervalo em segundos de cada medicao sendo demonstrado na seguencia de figuras abaixo Figura 24 Acessando a 5 SET INTERVAL FOR TIMED READINGS Fonte Laboratorio do DCEEng 60 Figura 25 Ajustando o intervalo em 5 segundos de medi o dos dados Fonte Laboratorio do DCEEng Apos pressionamos EXIT 3 vezes e voltamos a tela principal do Drantz concluindo assim a configuragao inicial do mesmo Realizando as medi es de energia A sequ ncia de figuras abaixo ilustra o passo a passo realizado no aparelho em cada medi o de energia salientando que a cada medi o o aparelho era desligado para a remo o do cart o de mem ria para coleta dos dados Figura 26 Ligando o aparelho Fonte Laborat rio do DCEEng 61 Figura 27 Inicializagao do Dranetz er Platform Fonte Laboratorio do DCEEng Apos inicializar o aparelho guestiona se desejamos selecionar sondagem de corrente Basta pressionar o botao correspondente a opgao YES Figura 28 Confirmando a utiliza o de sondagem de corrente Fonte Laborat rio do DCEEng Na tela seguinte devemos selecionar o tipo de sonda utilizada TR2510 em nosso caso utilizamos apenas o canal A ignorando os demais canais Neste caso j est correto o modelo da sonda basta pressionar EXIT 62 Figura 29 Definindo o tipo da sonda utilizada Fonte Labo
62. ra o Fonte ICEL PS 1500 Ligar os equipamentos Configurar Ponta de prova de corrente Agilent 1146A AC DC current probe conforme especificado no Tutorial de configura o do Oscilosc pio Ap s isto Com uma ponteira com ponta jacar dar 10 voltas na ponta de prova Ligar a ponteira na fonte ICEL PS 1500 no polo positivo e com a ponta jacar ligar esta em outra ponteira jacar que ser ligada no polo negativo da fonte Ligar a ponta de prova em 100mV A Ligar a fonte Girar o regulador de tens o da fonte at que no indicador da corrente se acenda uma luz vermelha Girar o regulador de corrente at 0 40 A Desta forma a fonte ira gerar uma corrente de 0 40 A ou 400mA A partir de agora o nico equipamento em que ser alterado alguma coisa na ponta de prova de corrente do oscilosc pio Provavelmente o valor que ira ser exibido na tela do oscilosc pio em ma ser diferente do valor que esta sendo gerado pela fonte Se o valor apresentado na tela do oscilosc pio for maior que o valor gerado pela fonte voc deve girar o regulador da ponta de prova no sentido anti hor rio De outra forma se o valor apresentado no visor do oscilosc pio for menor que o gerado pela fonte voc deve girar o regulador no sentido hor rio Quando os valores apresentados pelo oscilosc pio e pela fonte forem id nticos considera se que a ponta de prova de corrente do oscilosc pio est configurada corretamente e pode se come ar
63. ratorio do DCEEng Agora vamos desativar os canais B C e D que n o iremos utilizar pressionando o bot o SELECT CHANNEL Figura 30 Acessando menu para desabilitar canais desnecess rios Fonte Laborat rio do DCEEng Para desativar um canal basta apertar o bot o NEXT CHANEL para trocar de canal A B C ou D e ap s pressionar os bot es VOLTS ON OFF e AMPS ON OFF para desativar as medi es nos canais desejados B Ce D Ao finalizar de desativar a medi o nos canais B C e D o resultado dever ser conforme a imagem na sequencia Ap s basta pressionar o bot o EXIT e retornar a tela principal 63 Figura 31 Canais B C e D desativados Fonte Laboratorio do DCEEng Para acompanhar melhor a medi o de energia na tela principal pressionamos o bot o METER MODE Figura 32 Alterando a visualiza o da medi o de energia Fonte Laborat rio do DCEEng Ap s pressionamos NEXT METER para a exibi o da medi o desejada 64 Figura 33 Alterando para a pr xima visualiza o da medi o de energia Fonte Laborat rio do DCEEng Exibi o da tela de medi o desejada Para sair da tela basta pressionar EXIT Figura 34 Tela utilizada para acompanhar as medi es de energia Fonte Laborat rio do DCEEng Salvando os dados e exportando para arquivo TXT Com o equipamento j ligado e em funcionamento na tela principal basta acessar a
64. s Eles assumem o risco de que algumas partes dos programas podem ser removidas por um compilador de otimiza o RAUBER e RUNGER 2010 S o aqueles cujo c digo n o faz nenhuma computa o til n o representa nenhuma aplica o real somente exercita alguns componentes b sicos do computador Geralmente tentam determinar uma frequ ncia m dia de instru es t picas comumente utilizadas e recri las em um programa Os mais conhecidos s o o Whetstone e o Dhrystone IDA 2000 3 2 2 Kernel 21 A maioria dos aplicativos projetados atualmente n o s utilizam processamento mas tamb m necessita de uma grande quantidade de opera es de input output com a ajuda de dispositivos externos Assim estes se tornaram uma parte integrante da carga de trabalho que precisa ser considerada para a avalia o do desempenho do sistema no mundo real OBAIDAT e BOUDRIGA 2010 S o baseados no fato de que a maior parte da computa o de um programa concentrada em uma pequena parte de seu c digo Esta pequena parte chamada de n cleo kernel extra da do programa e usada como benchmark Deve ser ressaltado que eles n o servem para avaliar completamente o desempenho de uma m quina S o bastante interessantes por sua simplicidade e pequeno tamanho Um bom exemplo para este tipo de programa o Livermore Loops IDA 2000 Conforme Thomas 2010 benchmarks kernel s o partes pequenas mas relevantes de aplica es reais q
65. solving the linear system The following parameter values will be used N 5800 NB 592 PMAP Row major process mapping P d 1 Q 1 PFACT Left NBMIN 5 2 NDIV 2 RFACT Left BCAS lring DEPTH 0 SWAP Mix threshold lt 64 L1 transposed form U transposed form EQUIL yes ALIGN 8 double precision words The matrix A is randomly generated for each test The following scaled residual check will be computed Ax b oo eps x oo A oo b 00 N The relative machine precision eps is taken to be 1 110223e 16 Computational tests pass if scaled residuals are less than 16 0 T V N NB P Q Time Gflops WROOL2L2 5800 592 1 1 32 65 3 986e 00 Ax b oo eps A oo x ooft b oo N 0 7009 54613 c uses PASSED Finished tests with the following results 1 1 tests completed and passed residual checks 0 tests completed and failed residual checks 0 tests skipped because of illegal input values Anexo H Algoritmo mult seguencial c Algoritmo de multiplicagao de matrizes com processamento seguencial include lt stdio h gt include tempo h define L 1000 define C 1000 int m1 C L m2 C L m3 C IL void inicializa matriz void mostra matriz void multiplica void mostra resultado int main int argc char argv inicializa matriz mostra matriz tempo multiplica tempo2 if mostr
66. sys time h gt struct timeval t1 t2 struct timezone tz1 tz2 char MSGLOG 200 armazena o log no arquivo void tempo1 gettimeofday 8t1 8121 void tempo2 gettimeofday amp t2 amp tz2 void tempoFinal const char medida char nomeArquivo char msglog char tempo 50 long int micro t2 tv_sec 1000000 t2 tv_usec t1 tv sec 1000000 4t1 tv usec if strcmp medida 0 sprintf tempo Tempo total 2f s n micro 1000000 0 if stremp medida micro segundos 0 sprintf tempo Tempo total ld us n micro if stremp medida mili segundos 0 sprintf tempo Tempo total 2f ms n micro 1000 0 if stremp medida segundos 0 sprintf tempo Tempo total 2f s n micro 1000000 0 if stremp medida minutos 0 sprintf tempo Tempo total 2f min n micro 1000000 0 60 if stremp medida horas 0 sprintf tempo Tempo total 2f horas n micro 1000000 0 60 60 printf n s n tempo
67. tacional de um processador presente atualmente nos celulares ARM e de um processador de desktop x86 Para tais avalia es optou se por rodar como benchmarks um programa que executa a multiplica o de duas matrizes de ordem 1000 e o HPL High Performance Linpack Este programa foi executado em modo sequencial e com 2 duas threads compilado nos modos default com otimiza o O1 e 2 O desempenho foi avaliado atrav s do tempo de execu o dos algoritmos obtidos atrav s da biblioteca tempo h presente na sess o 4 4 e atrav s da execu o do benchmark HPL parte integrante do Linpack A execu o do HPL retorna ao usu rio um valor em MFLOPS ou GFLOPS que representa o n mero de opera es de ponto flutuante executadas num intervalo de 1 segundo pelo processador Al m do desempenho computacional buscou se tamb m mensurar o consumo de energia realizado pelos equipamentos durante a execu o destes algoritmos para avaliar o desempenho deles com rela o ao consumo de energia Outra forma de medir o desempenho de equipamentos atrav s do tempo de execu o esta metodologia tamb m foi utilizada na realiza o deste trabalho Pois o tempo de execu o de alguma tarefa tamb m um fator crucial para o usu rio dependendo de qual a pretens o de uso que o mesmo pretende fazer de um equipamento Os equipamentos avaliados representam duas classes distintas de hardwares sendo um deles um desktop padr o com processa
68. tida levou apenas 5 09 do tempo que o processador ARM levou para executar ou seja apesar de consumir 8 41 vezes mais energia ele foi quase 20 vezes mais r pido Pode se notar tamb m que a medida que vai se otimizando o algoritmo a diferen a entre o consumo das duas arquiteturas vai aumentando com o x86 chegando a consumir 12 41 vezes mais energia que a ARM medida que a diferen a no consumo de energia aumenta a diferen a entre os tempos de execu o diminui por m uma quantia pouco significativa A tabela 4 apresenta em percentagem a redu o em consumo e em tempo da arquitetura ARM quando o algoritmo foi recompilado utilizando as flags de otimiza o O1 e 2 em sequencial e O1 e O2 executando em paralelo comparando se com a execu o sequencial com a otimiza o padr o do GCC Tabela 4 redu o de consumo e tempo de execu o utilizando otimiza es na Arquitetura ARM redu o redu o Consumo Wh Tempo S 9 consumo no tempo ARM Sequencial O 0 1113018 318 97 100 00 100 00 O1 0 0625016 184 95 43 84 42 02 O2 0 0621746 180 78 44 14 43 32 Thread O 0 0947602 277 49 14 86 13 00 O1 0 0562187 166 24 49 49 47 88 2 0 0549800 160 26 50 60 49 6 Como se pode ver na tabela acima ao recompilar o algoritmo sequencial utilizando se as otimiza es fornecidas pelo GCC obteve se redu es de 43 84 a 44 14 no consumo de energia e redu es de 42 02 e 43 32 no tempo
69. ttp dranetz com dran view 6 11 02 trial zip gt Figura 42 Tela principal do Dran View gt oa 6601 rde Demo dys mero NN File View Tools Help ig Mix amis So Go Bei ww Brez ji IRA ras 4 Events 1 4 121 il d Templates Disabled CAP NUM SCRL Fonte print do software em execu o 69 Para efetuarmos a exportagao dos arguivos precisamos habilitar uma barra de ferramentas Adittional Tools habilitamos esta barra ao clicar com o bot o direito do mouse sobre alguma das barras j existentes selecionando a op o Additional Tools Additional tools a qual disponibiliza o bot o properties Apos basta abrir os arquivos salvos clicar no botao properties acima citado e selecionar o que desejamos exportar conforme pode ser visualizado na imagem abaixo Figura 43 Selecionando as informag es desejadas Chart properties x D OV E eer pe St Basic Metering Adv Metering L Harmonics L V Harmonics L 1 Harmonics H HCI Channels 2x W Basic Metering E A Adv Metering AJBJ CI D A BJTOT Harmonics Vms v Voltage RMS value V Harmonics Ims Current RMS value I Harmonics VTrans Voltage Transient value
70. ue normalmente capturam uma grande parcela do tempo de execu o de aplica es reais Comparado a programas reais benchmarks kernel t m a vantagem de que s o muito mais curtos e f ceis de analisar RAUBER e RUNGER 2010 Benchmarks de kernel n o consideram os dispositivos de entrada e sa da caracterizando o desempenho dos sistemas apenas com base na performance do processador A grande desvantagem de utilizar estes tipos de benchmark que eles n o fazem uso de dispositivos de l O para o c lculo do desempenho do sistema assim o desempenho do kernel n o ir visualizar o desempenho do sistema como um todo OBAIDAT e BOUDRIGA 2010 3 2 3 Algoritmo Para Ida 2000 s o algoritmos bem definidos geralmente implementa es de Linpack m todos conhecidos em computa o num rica como por exemplo os m todos de resolu o de equa es lineares lgebra linear que fazem parte do benchmark 3 2 4 Aplica o Segundo Ida 2000 benchmarks de aplica o s o programas completos que resolvem problemas cient ficos bem definidos Um exemplo o SPEC Benchmarks do tipo aplica o s o utilizados principalmente para avaliar o desempenho dos sistemas que s o usadas para uma determinada aplica o tais como reserva de linha a rea servi os banc rios classifica o previs o do tempo e assim por diante Para essas 22 aplica es benchmarks s o definidos como um grupo coletivo de fun es gue fazem
71. va de corrente TR2510 4 2 2 Oscilosc pio Agilent DSO1002A Segundo Roque 2007 o oscilosc pio um instrumento de medida destinado a visualizar um sinal el ctrico Como muitas grandezas f sicas s o medidas atrav s de um sinal el ctrico e que o oscilosc pio um instrumento muito sens vel tens o permite obter os valores instant neos de sinais el ctricos r pidos a medi o de tens es e correntes el ctricas e ainda frequ ncias e diferen as de fase de oscila es Figura 3 Oscilosc pio Agilent DSO1002A 60MHz l Run Conu Agilent Technologies DSO1002A pone 3658 5 Push 29 4 2 2 1 Ponta de prova de Corrente 1146A A ponta de prova de corrente 1146A uma ferramenta espec fica para uso em oscilosc pios fabricada pela Agilent f cil de configurar e calibrar altamente confi vel e precisa Figura 4 Ponta de prova de corrente 1146A 4 2 3 Ponta de prova de tens o A ponta de prova LF 20A fabricada para uso exclusivo em oscilosc pios para a mensuracao de tensao Figura 5 Ponta de prova de oscilosc pio LF 20A 4 2 4 Fonte para calibrac o da ponta de prova A fonte ICEL OS 1500 foi utilizada para calibrar a ponta de prova de corrente 1146A do Oscilosc pio fazendo com que a precis o da medida fornecida pela ponta de prova fosse pr xima dos 100 Figura 6 Fonte ICEL PS 1500 30 31 5 ESTUDO DE CASO O objetivo deste trabalho e avaliar o desempenho compu

Download Pdf Manuals

image

Related Search

Related Contents

DELL OptiPlex 9020  取 扱 説 明 書  Datasheet – Wave Virtual Smart Card 2.0  Coagulometer Koag-o-test Vet User Manual  Digital Photo Frame  SC-2030 Solar Charge Controller User`s Manual  Brenthaven Fusion III MB  Xerox Phaser 6700 User's Manual  

Copyright © All rights reserved.
Failed to retrieve file