Sophie

Sophie

distrib > Fedora > 15 > i386 > by-pkgid > c56d4494d1c733a5994eb89706b71f1d > files > 61

fflas-ffpack-devel-1.4.2-1.fc15.i686.rpm

Repenser la structure de fgemm:
  * plus de template, moins de tests
  * templater DoubleDomain/FLoatDomain?
  * plus rapide avec des petites matrices
  * Meilleure strategie de calcul des parametres
  * Automatic tuning des thresholds Float/Double

LUdivine
  * Automatic tuning des thresholds gauss/LUdivine
  * Plus de localite?

TRSM/TRMM
  * Traitement automatique float/double depuis int
  * Securiser les bornes t_update: quand winograd intervient
  * remplacer BLAS-trsm par le code de reference de ATLAS

FTRTRI/FTRTRM
  * generation automatique du code
  * traitement des cas de base (seuil > 1)
 
Idee: 
1/ Pourquoi templater FFLAS?
  --> integration au sein de ATLAS (C et corps definitif)
2/ ameliorer les cas terminaux de ftrsm ftrmm: copier les ATL_reftrsm sur double et float
  --> introduire un nouveau seuil dans trsm: celui ou on fait des boucles et pas de la recursivite
2/ Conversion des le debut vers modular double/float (evite les conv multiples)
3/ Implantations non template de fgemm, trsm, .... sur double
4/ Compilation des noyaux

A discuter en fonction du besoin d'un FFLAS generique


Verifier la validite avec modular<int> (sage révele des det faux)

Revoir la structure des bornes dans winograd: trop de reductions
   modulaires quand il y a des etapes de wino dans le corps fini.