e7712a9c180bf225a7e1095f8979122bd5cf8b27
[valse.git] / src / sources / constructionModelesLassoRank.c
1 #include <stdlib.h>
2 #include <omp.h>
3 #include <gsl/gsl_linalg.h>
4 #include "EMGrank.h"
5 #include "utils.h"
6
7 // TODO: comment on constructionModelesLassoRank purpose
8 void constructionModelesLassoRank_core(
9 // IN parameters
10 const double* Pi,// parametre initial des proportions
11 const double* Rho, // parametre initial de variance renormalisé
12 int mini, // nombre minimal d'itérations dans l'algorithme EM
13 int maxi, // nombre maximal d'itérations dans l'algorithme EM
14 const double* X,// régresseurs
15 const double* Y,// réponse
16 double tau, // seuil pour accepter la convergence
17 const int* A1, // matrice des coefficients des parametres selectionnes
18 int rangmin, //rang minimum autorisé
19 int rangmax, //rang maximum autorisé
20 // OUT parameters (all pointers, to be modified)
21 double* phi,// estimateur ainsi calculé par le Lasso
22 double* lvraisemblance,// estimateur ainsi calculé par le Lasso
23 // additional size parameters
24 int n,// taille de l'echantillon
25 int p,// nombre de covariables
26 int m,// taille de Y (multivarié)
27 int k,// nombre de composantes
28 int L)// taille de glambda
29 {
30 //On cherche les rangs possiblement intéressants
31 int deltaRank = rangmax-rangmin+1;
32 int Size = (int)pow(deltaRank,k);
33 int* Rank = (int*)malloc(Size*k*sizeof(int));
34 for (int r=0; r<k; r++)
35 {
36 //On veut le tableau de toutes les combinaisons de rangs possibles
37 //Dans la première colonne : on répète (rangmax-rangmin)^(k-1) chaque chiffre : ca remplit la colonne
38 //Dans la deuxieme : on répète (rangmax-rangmin)^(k-2) chaque chiffre, et on fait ca (rangmax-rangmin)^2 fois
39 //...
40 //Dans la dernière, on répète chaque chiffre une fois, et on fait ca (rangmin-rangmax)^(k-1) fois.
41 int indexInRank = 0;
42 int value = 0;
43 while (indexInRank < Size)
44 {
45 for (int u=0; u<pow(deltaRank,k-r-1); u++)
46 Rank[mi(indexInRank++,r,Size,k)] = rangmin + value;
47 value = (value+1) % deltaRank;
48 }
49 }
50
51 //Initialize phi to zero, because unactive variables won't be assigned
52 for (int i=0; i<p*m*k*L*Size; i++)
53 phi[i] = 0.0;
54
55 //initiate parallel section
56 int lambdaIndex;
57 omp_set_num_threads(OMP_NUM_THREADS);
58 #pragma omp parallel default(shared) private(lambdaIndex)
59 {
60 #pragma omp for schedule(dynamic,CHUNK_SIZE) nowait
61 for (lambdaIndex=0; lambdaIndex<L; lambdaIndex++)
62 {
63 //On ne garde que les colonnes actives : active sera l'ensemble des variables informatives
64 int* active = (int*)malloc(p*sizeof(int));
65 int longueurActive = 0;
66 for (int j=0; j<p; j++)
67 {
68 if (A1[mi(j,lambdaIndex,p,L)] != 0)
69 active[longueurActive++] = A1[mi(j,lambdaIndex,p,L)] - 1;
70 }
71
72 if (longueurActive == 0)
73 continue;
74
75 //from now on, longueurActive > 0
76 double* phiLambda = (double*)malloc(longueurActive*m*k*sizeof(double));
77 double LLF;
78 for (int j=0; j<Size; j++)
79 {
80 //[phiLambda,LLF] = EMGrank(Pi(:,lambdaIndex),Rho(:,:,:,lambdaIndex),mini,maxi,X(:,active),Y,tau,Rank(j,:));
81 int* rank = (int*)malloc(k*sizeof(int));
82 for (int r=0; r<k; r++)
83 rank[r] = Rank[mi(j,r,Size,k)];
84 double* Xactive = (double*)malloc(n*longueurActive*sizeof(double));
85 for (int i=0; i<n; i++)
86 {
87 for (int jj=0; jj<longueurActive; jj++)
88 Xactive[mi(i,jj,n,longueurActive)] = X[mi(i,active[jj],n,p)];
89 }
90 double* PiLambda = (double*)malloc(k*sizeof(double));
91 for (int r=0; r<k; r++)
92 PiLambda[r] = Pi[mi(r,lambdaIndex,k,L)];
93 double* RhoLambda = (double*)malloc(m*m*k*sizeof(double));
94 for (int u=0; u<m; u++)
95 {
96 for (int v=0; v<m; v++)
97 {
98 for (int r=0; r<k; r++)
99 RhoLambda[ai(u,v,r,m,m,k)] = Rho[ai4(u,v,r,lambdaIndex,m,m,k,L)];
100 }
101 }
102 EMGrank_core(PiLambda,RhoLambda,mini,maxi,Xactive,Y,tau,rank,
103 phiLambda,&LLF,
104 n,longueurActive,m,k);
105 free(rank);
106 free(Xactive);
107 free(PiLambda);
108 free(RhoLambda);
109 //lvraisemblance((lambdaIndex-1)*Size+j,:) = [LLF, dot(Rank(j,:), length(active)-Rank(j,:)+m)];
110 lvraisemblance[mi(lambdaIndex*Size+j,0,L*Size,2)] = LLF;
111 //dot(Rank(j,:), length(active)-Rank(j,:)+m)
112 double dotProduct = 0.0;
113 for (int r=0; r<k; r++)
114 dotProduct += Rank[mi(j,r,Size,k)] * (longueurActive-Rank[mi(j,r,Size,k)]+m);
115 lvraisemblance[mi(lambdaIndex*Size+j,1,Size*L,2)] = dotProduct;
116 //phi(active,:,:,(lambdaIndex-1)*Size+j) = phiLambda;
117 for (int jj=0; jj<longueurActive; jj++)
118 {
119 for (int mm=0; mm<m; mm++)
120 {
121 for (int r=0; r<k; r++)
122 phi[ai5(active[jj],mm,r,lambdaIndex,j,p,m,k,L,Size)] = phiLambda[jj*m*k+mm*k+r];
123 }
124 }
125 }
126 free(active);
127 free(phiLambda);
128 }
129 }
130 free(Rank);
131 }