Home
Cahier des charges - Présentation du projet.
Contents
1. Vos principaux algorithmes devront tre implant s en OCaml en particulier vous devrez tablir une interface de communication claire entre le chargement et la sauvegarde des donn es en C et leur utilisation en OCaml L implantation du r seau de neurones devra utiliser les aspects objets d OCaml Enfin le partie principale gestion de la ligne de commande et ou lancement d une interface gra phique du programme est r aliser en OCaml Dans la mesure du possible l interface graphique devra tre autonome et ex cut e dans un thread diff rent de la partie traitement Ces recommandations sont strictes mais dans le cas o vous voudriez choisir un d coupage diff rent ce choix devra tre clairement pr cis et justifi Les justifications acceptables pour remplacer une partie en OCaml par une partie en C sont Si vous avez besoin d effectuer des manipulations directs de la m moire mmap sbrk Si vous avez besoin d utiliser une biblioth que ne disposant pas d une version pour OCaml Remarque Il n y a pas de bonne justification pour remplacer une partie en C par une partie en OCaml Attention Ces modifications au d coupage recommand doivent tre minimales Si vous pouvez isoler la partie en C et r aliser une interface d acc s un stub en OCaml vous devez le faire Notamment pour l usage de biblioth que non disponible en OCaml nous vous conseillons de cr er un stub inte
2. Plusieurs pr sentations possibles Chronologique groupe Chronologique individuelle Individuelles r partition des t ches Autres R cit de la r alisation Ses joies Ses peines Etc Les annexes comprennent Les exemples d impression les exemples d cran les jeux d essai les dessins d origine Etc Remarques Quelle que soit la structure retenue pour les rapports chronologique individuelle etc elle doit dans tous les cas d crire de mani re tr s EXPLICITE qui a fait quoi Un Dossier d exploitation la derni re soutenance Le dossier d exploitation doit contenir les l ments suivants Manuel d installation Manuel d utilisation Le projet la derni re soutenance Le projet un ex cutable doit tre accompagn des l ments suivants Les sources Les diff rentes biblioth ques utilis es par votre projet Une proc dure d installation D sinstallation la derni re soutenance Celle ci doit permettre d installer le projet le site et tous les l ments qui les accompagnent Bien s r le choix des l ments installer doit tre possible et il va de soit qu une proc dure de d sinstallation est fournie lUne aide contextuelle doit tre int gr e aux ex cutables du projet
3. La d tection de police manuscrite particuli rement complexe L imposition d utilisation de certaines biblioth que de programme etc Projet Info Spe CAHIER DES CHARGES 2006 07 EPITA 1 Nature et but de ce projet Qu est ce que C est un logiciel de reconnaissance de caract res manuscrits et imprim s apprentissage automatique Si vous poss dez un scanner il vous suffit de scanner l image et le logiciel le transcrira pour vous en texte mis en forme Principe Le principe est simple L utilisateur fournit au logiciel plusieurs documents A4 num ris s contenant la liste des symboles reconna tre son criture et ce en plusieurs exemplaires ainsi que la traduction de ces symboles en texte ASCII Le logiciel utilise cette base d informations pour l apprentissage d un profil utilisateur Ensuite lorsque l utilisateur veut convertir un document num ris sous forme d image en texte il ouvre simplement le document dans le logiciel et lance la proc dure de conversion Le logiciel donne alors l quivalent du texte mis en forme R gles respecter Pour que le d veloppement de ce projet se passe le mieux possible nous allons respecter les r gles de codage suivantes Pour les parties en OCaml Indentation des fonctions obligatoire Pas plus de 40 lignes par fonction Les noms de fonctions variables constantes et macros devront tre en anglais Mettre un maximum de commentair
4. neurones ne sera pas la seule t che effectuer il faudra galement trouver une bonne repr sentation des donn es caract risant l image d un symbole et standardiser ces donn es d entr e pour le r seau de neurones Il faudra galement g rer le cas des caract res trop ambigus ou trop difficiles reconna tre Le clas sifieur devra les rejeter pour pouvoir ensuite les traiter au niveau de l interface 2 4 Interface graphique en C ou OCaml Une interface graphique quoique non n cessaire reste n anmoins une fa on intuitive et rapide d uti liser un logiciel Cette interface sera relativement simple Une zone de texte afin de permettre l utilisateur de modifier le texte du document num ris prendra la moiti de la fen tre L autre moiti tant consacr e la visualisation du document original afin de pouvoir v rifier la similarit des textes Projet Info Spe CAHIER DES CHARGES 2006 07 EPITA 3 Interface en C ou OCaml Ce projet est r aliser en C et en OCaml Le d coupage entre les deux langages doit suivre les recom mandations suivantes Le chargement la sauvegarde et les manipulations des fichiers sont r aliser en C Les pr traitements et toutes les manipulations d images seront r aliser en C L interface graphique est r aliser l aide de la biblioth que graphique GTK L usage de la version OCaml de la biblioth que GTK lablgtk est autoris e
5. Projet Info Spe CAHIER DES CHARGES 2006 07 EPITA Cahier des charges Projet Info SPE 2006 07 mardi 23 janvier 2007 Cadre Le projet est r aliser en groupe de quatre personnes et seulement quatre Sa dur e est d environ quatre mois de F vrier Juin Ce cahier des charges pr sente la nature du projet les diff rentes parties qui le composent et les d lais de r alisation planning Le sujet Le projet que vous allez devoir r aliser est un logiciel de reconnaissance de caract res un O C R pour Optical Character Recognition Il va permettre de r cup rer dans un traitement de texte des documents imprim s courriers pages de livre articles de presse Apr s num risation le logiciel attribue chaque symbole du texte le caract re correspondant partir d un profil entra n avec des exemples Mais la transformation en texte brut d une page num ris e n est pas la seule fonctionnalit du logiciel Il analyse galement le mot reform avec un dictionnaire pour diminuer le nombre d erreurs Restrictions Ce projet sera d velopp sous NetBsd et sera cod en C et Objective Caml Ce projet en plus d tre techniquement int ressant permettra comme le sujet est unique pour tous les groupes de se positionner par rapport aux autres et d tablir un vrai challenge quant sa r alisation et ses performances Protocole Vous devez choisir un groupe de quatre personnes donner un nom ce groupe c
6. amplifier les marques des caract res Il faudra donc envisager diff rentes m thodes de rotation d images et de d tection d inclinaison du texte Il faudra aussi trouver une m thode pour discerner le bruit de fond des caract res Dans le cas id al l image qui sortira de ce traitement sera un fichier bitmap sur lequel les caract res seront en noir sur fond blanc et dispos s horizontalement Selon l tat des images fournies traiter il sera difficile ou plut t inutile de vouloir un fond absolument blanc Le traitement de l image dans cette partie tant global il ne rentre pas dans le d tail du document Certaines t ches ne seront donc supprim es que lors d une analyse plus pointue de l image Par exemple une t che sur la feuille qui masquerait plusieurs caract res ne pourra pas tre d tect e lors de cette premi re phase du projet mais uniquement lors de l extraction des caract res ou de leur interpr tation 2 2 Analyse de l image et extraction des caract res en OCaml Cette partie fonctionne partir d un document parfait issu de la phase de pr traitement de l image Elle est essentielle puisqu elle va fournir les caract res d coup s au syst me de reconnaissance Il faudra donc cr er des algorithmes capables de d tecter des lignes et des caract res et de stocker les coordonn es en m moire d une mani re assez fonctionnelle pour qu elle soit exploitable simplement Les algorithme
7. es tablir une hi rarchie correct et coh rente des modules ne contenant pas de cycle Les modules devront tre utilis avec la notation point Module fonction la directive open est prohib e Pour chaque fichier ml vous devrez faire un fichier mli Pour chaque module interne vous devrez fournir sa signature Pas plus de 3 niveaux d imbrication de modules 80 caract res par ligne Pas d espace en fin de ligne dans les fichiers ml et mli Aucun warning la compilation Projet Info Spe CAHIER DES CHARGES 2006 07 EPITA Pour les parties en C Indentation des fonctions obligatoire Pas plus de 40 lignes par fonction Pas de variable globale Les noms de fonctions variables constantes et macros devront tre en anglais Mettre un maximum de commentaires Faire une hi rarchie coh rente des fichiers c Pour chaque fichier c faire un fichier h 80 caract res par ligne Pas d espace en fin de ligne dans les fichiers c et h Aucun warning la compilation avec les drapeaux de compilation suivants Wall W pedantic Pour le projet Votre projet doit disposer d un Makefile compatible avec GNU Make Votre Makefile devra fournir une r gle opt pour construire un binaire natif dont le nom sera suffix par opt et une r gle byte pour une construire un binaire en bytecode Par d faut la r gle all produit les deux
8. hoisir un sujet de projet et remettre le nom du groupe le nom des membres le login de chaque membre le nom du projet ainsi que le nom de celui que vous aurez d sign comme chef de projet cf date limite de choix de groupe Un chef de projet est n cessaire pour servir entre autres d interlocuteur aux jurys des soutenances Les soutenances Les soutenances durent l exception de la derni re 15 minutes Elles sont au nombre de trois Elles se suivent et donc tout retard de votre part entra ne une diminution de votre temps de parole Il faut donc faire une pr sentation claire nette et pr cise de l tat d avancement de votre projet et r pondre de la mani re la plus claire et la plus concise possible aux questions du jury Les deux premi res soutenances auront lieu en soir e partir de 17h30 Dates des soutenances Premi re du 5 au 9 Mars 2007 Deuxi me du 2 au 6 Avril 2007 Finale du 28 au 31 Mai 2007 Projet Info Spe CAHIER DES CHARGES 2006 07 EPITA Le jury Les soutenances seront assur s pour les deux premi res par les Vakas avec ventuellement un ensei gnant La derni re soutenance finale sera effectu e par un enseignant assist des Yakas vous ayant suivis lors des pr c dentes soutenances Bonus Bien videmment des ajouts et ou modifications pourront tre effectu s en cours d ann e ce ca hier des charges D tection d images de photos de nouveaux formats de typographie etc
9. qui a t r alis depuis la derni re soutenance ou depuis la validation du cahier des charges pour la premi re soutenance Sa pr sentation peut tre calqu e sur celle du rapport de projet pr sent plus loin Il doit tre remis au d but de chaque soutenance Il doit faire le bilan de ce qui a t fait avances et ou retards sur planning par qui et pr senter ce qui doit tre fait pour la prochaine fois IToute pr sentation qu elle soit crite ou orale doit contenir un plan ainsi qu une introduction et une conclusion Projet Info Spe CAHIER DES CHARGES 2006 07 EPITA Un site Web chaque soutenance Celui ci doit contenir une page d accueil permettant d acc der aux diff rents l ments suivants Une pr sentation du projet l historique les membres la chronologie de r alisation les probl mes rencontr s les solutions envisag es Les liens sur les sites des membres des logiciels images sons librairies applets et autres l ments que vous auriez pu utiliser Un download du rapport du projet et d une version lite de celui ci sans toutes les choses inutiles l ex cution du projet Un rapport de projet la derni re soutenance Il est remettre lors de la derni re soutenance il doit contenir 50 pages minimum annexes non comprises les sources du projet sont fournies hors rapport Une structure acceptable pourrait tre Reprise du cahier des charges
10. rface C OCaml pour la biblioth que ou tout du moins pour la partie utilis e Nous vous conseillons de d couper chaque partie dans un module autonome pouvant tre remplac Pour ce faire vous devrez tablir une interface de communication claire structures des donn es et fonc tions d acc s simple sans aller retour avec le module La partie chargement pr traitement disposera d une interface en OCaml mais sera implant en C La ligne de commande de votre programme doit fournir au moins les options help et help qui affichent une aide succincte br ve description format de la ligne de commande et liste des options accompagn es d une br ve description Si au moins une option est n cessaire votre programme affichera galement l aide s il est appeler sans option Projet CAHIER DES CHARGES 2006 07 Info Spe EPITA 4 Calendrier des soutenances Comme vous devez tre quatre par groupe le calendrier est d coup en quatre mais ce n est qu titre indicatif Ce qui importe ce sont les t ches qui doivent tre r alis es pour chaque soutenance l re soutenance Les diff rentes m thodes de rotation d image et de gom mage de bruits de fond D tection de l angle de rotation d une image pour la redresser une pre mi re application de gommage de bruits de fond Premi re version du pr traitement de l image bauche de linter face graphique 2 me so
11. s devront tre bien pens s et la structure modulable en cas de modification Le principe est simple Le document va isoler les pixels fonc s et clairs pour situer globalement le texte sur l image et rep rer dans un premier temps les lignes Ensuite il faudra d tecter les bornes hautes et basses de chaque ligne Une fois cette tape r alis e on fera une d tection des caract res en les encadrant par la largeur et gr ce aux bornes de la ligne on isolera plus pr cis ment les caract res en hauteur Ensuite toutes ces informations stock es seront envoy es au syst me de reconnaissance des caract res et serviront galement la mise en page du texte Il faudra aussi tester un maximum d exemples pour d tecter les cas qui ne fonctionneraient pas et les modifier pour obtenir la meilleure d tection possible 2 3 Reconnaissance des caract res en OCaml Il a t d cid que la reconnaissance s effectue par apprentissage automatique La reconnaissance des caract res utilisera comme technique d apprentissage les r seaux de neurones Le travail consistera d abord r aliser la partie d apprentissage de chaque symbole d tecter et ensuite celle effectuant la Projet Info Spe CAHIER DES CHARGES 2006 07 EPITA classification des symboles convertir en texte Ce travail se fera sur des symboles d j isol s par la partie Analyse de l image et extraction des caract res Mais la r alisation du r seau de
12. types de binaires Votre Makefile devra contenir une r gle clean pour effacer tous les produits de la compilation Un fichier README qui explique comment compiler et utiliser votre projet Projet Info Spe CAHIER DES CHARGES 2006 07 EPITA 2 D coupage du projet Pour effectuer un partage des t ches le d coupage des t ches sera fait de la fa on suivante 1 Pr traitement de l image de d part num ris e partir d un document A4 par l effacement de bruits afin de produire un document parfait 2 Extraction des lignes des caract res et d tection de la mise en forme du document nous nous contenterons dans un premier temps de la typographie des caract res gras italique soulign etc 3 Codage des caract ristiques d une image d un caract re et apprentissage machine des caract ris tiques de chaque symbole d tecter 4 D veloppement de l interface visuelle de l application interpr tation et affichage de la mise en forme du document d tect ant rieurement et d finition de balises de mise en forme du document texte le format des balises est le html 2 1 Pr traitement de l image en C Concr tement il s agira de transformer l image d origine en la faisant pivoter dans le cas o l image n est pas droite pour une reconnaissance ult rieure plus facile des caract res et de faire ressortir le trac des caract res c est dire Gommer le bruit de fond et
13. utenance Pr sentation de la d tection du positionnement des lignes partir d un fichier image parfait D tection du posi tionnement des ca ract res et d cou page Mise en relations des modules du projet Travail sur la mise en page Site Web Avance ment de l interface graphique 3 me soutenance Recherche sur lap prentissage et sur la repr sentation des images D veloppement des bases du module charg de la recon naissance des sym boles Int gration du mo dule de reconnais sance des symboles dans l application et gestion des sym boles non reconnus Interface graphique compl te Description des pi ces fournir A chaque soutenance vous devez fournir Un plan de soutenance Un rapport de soutenance Un site Web A la soutenance finale vous devez fournir Un plan de soutenance Un rapport de projet Le projet Un site Web Un dossier d exploitation Une proc dure d installation D sinstallation Un plan de soutenance chaque soutenance Il pr sente sur une page et sous la forme d un plan la fa on dont va se d rouler votre soutenance Cela sous entend videmment une pr paration de celle ci ne serait ce que bien g rer votre temps Il doit tre remis au d but de chaque soutenance Un rapport de soutenance chaque soutenance Il pr sente sur une vingtaine de pages minimum ce
Download Pdf Manuals
Related Search
Related Contents
JZC-E052HS LASER SELF-LEVELING PLUMMET utilización de técnicas de geovisualización virtual 3d para activar los LIVRET D`ACCUEIL Ch 3 Tutorial Only MAJC Box User Manual (download) 各部の名称 Copyright © All rights reserved.
Failed to retrieve file