[valse.git] / src / sources / EMGLLF.c

#include "EMGLLF.h"
#include <gsl/gsl_linalg.h>

// TODO: comment on EMGLLF purpose
void EMGLLF(
	// IN parameters
	const Real* phiInit,  // parametre initial de moyenne renormalisé
	const Real* rhoInit,  // parametre initial de variance renormalisé
	const Real* piInit,   // parametre initial des proportions
	const Real* gamInit,  // paramètre initial des probabilités a posteriori de chaque échantillon
	Int mini,      // nombre minimal d'itérations dans l'algorithme EM	
	Int maxi,      // nombre maximal d'itérations dans l'algorithme EM
	Real gamma,  // valeur de gamma : puissance des proportions dans la pénalisation pour un Lasso adaptatif
	Real lambda, // valeur du paramètre de régularisation du Lasso
	const Real* X,     // régresseurs
	const Real* Y,     // réponse
	Real tau,    // seuil pour accepter la convergence
	// OUT parameters (all pointers, to be modified)
	Real* phi,  // parametre de moyenne renormalisé, calculé par l'EM
	Real* rho,  // parametre de variance renormalisé, calculé par l'EM
	Real* pi,   // parametre des proportions renormalisé, calculé par l'EM
	Real* LLF,   // log vraisemblance associé à cet échantillon, pour les valeurs estimées des paramètres
    Real* S,
	// additional size parameters
	mwSize n,         // nombre d'echantillons
	mwSize p,         // nombre de covariables
	mwSize m,         // taille de Y (multivarié)
	mwSize k)         // nombre de composantes dans le mélange
{
	//Initialize outputs
	copyArray(phiInit, phi, p*m*k);
	copyArray(rhoInit, rho, m*m*k);
	copyArray(piInit, pi, k);
	zeroArray(LLF, maxi);
	//S is already allocated, and doesn't need to be 'zeroed'
	
	//Other local variables
	//NOTE: variables order is always [maxi],n,p,m,k
	Real* gam = (Real*)malloc(n*k*sizeof(Real));
	copyArray(gamInit, gam, n*k);
	Real* b = (Real*)malloc(k*sizeof(Real));
	Real* Phi = (Real*)malloc(p*m*k*sizeof(Real));
	Real* Rho = (Real*)malloc(m*m*k*sizeof(Real));
	Real* Pi = (Real*)malloc(k*sizeof(Real));
	Real* gam2 = (Real*)malloc(k*sizeof(Real));
	Real* pi2 = (Real*)malloc(k*sizeof(Real));
	Real* Gram2 = (Real*)malloc(p*p*k*sizeof(Real));
	Real* ps = (Real*)malloc(m*k*sizeof(Real));
	Real* nY2 = (Real*)malloc(m*k*sizeof(Real));
	Real* ps1 = (Real*)malloc(n*m*k*sizeof(Real));
	Real* ps2 = (Real*)malloc(p*m*k*sizeof(Real));
	Real* nY21 = (Real*)malloc(n*m*k*sizeof(Real));
	Real* Gam = (Real*)malloc(n*k*sizeof(Real));
	Real* X2 = (Real*)malloc(n*p*k*sizeof(Real));
	Real* Y2 = (Real*)malloc(n*m*k*sizeof(Real));
	gsl_matrix* matrix = gsl_matrix_alloc(m, m);
	gsl_permutation* permutation = gsl_permutation_alloc(m);
	Real* YiRhoR = (Real*)malloc(m*sizeof(Real));
	Real* XiPhiR = (Real*)malloc(m*sizeof(Real));
	Real dist = 0.0;
	Real dist2 = 0.0;
	Int ite = 0;
	Real EPS = 1e-15;
	Real* dotProducts = (Real*)malloc(k*sizeof(Real));
	
	while (ite < mini || (ite < maxi && (dist >= tau || dist2 >= sqrt(tau))))
	{
		copyArray(phi, Phi, p*m*k);
		copyArray(rho, Rho, m*m*k);
		copyArray(pi, Pi, k);
		
		// Calculs associes a Y et X
		for (mwSize r=0; r<k; r++)
		{
			for (mwSize mm=0; mm<m; mm++)
			{
				//Y2(:,mm,r)=sqrt(gam(:,r)).*transpose(Y(mm,:));
				for (mwSize u=0; u<n; u++)
					Y2[u*m*k+mm*k+r] = sqrt(gam[u*k+r]) * Y[u*m+mm];
			}
			for (mwSize i=0; i<n; i++)
			{
				//X2(i,:,r)=X(i,:).*sqrt(gam(i,r));
				for (mwSize u=0; u<p; u++)
					X2[i*p*k+u*k+r] = sqrt(gam[i*k+r]) * X[i*p+u];
			}
			for (mwSize mm=0; mm<m; mm++)
			{
				//ps2(:,mm,r)=transpose(X2(:,:,r))*Y2(:,mm,r);
				for (mwSize u=0; u<p; u++)
				{
					Real dotProduct = 0.0;
					for (mwSize v=0; v<n; v++)
						dotProduct += X2[v*p*k+u*k+r] * Y2[v*m*k+mm*k+r];
					ps2[u*m*k+mm*k+r] = dotProduct;
				}
			}
			for (mwSize j=0; j<p; j++)
			{
				for (mwSize s=0; s<p; s++)
				{
					//Gram2(j,s,r)=transpose(X2(:,j,r))*(X2(:,s,r));
					Real dotProduct = 0.0;
					for (mwSize u=0; u<n; u++)
						dotProduct += X2[u*p*k+j*k+r] * X2[u*p*k+s*k+r];					
					Gram2[j*p*k+s*k+r] = dotProduct;
				}
			}
		}

		/////////////
		// Etape M //
		/////////////
		
		// Pour pi
		for (mwSize r=0; r<k; r++)
		{
			//b(r) = sum(sum(abs(phi(:,:,r))));
			Real sumAbsPhi = 0.0;
			for (mwSize u=0; u<p; u++)
				for (mwSize v=0; v<m; v++)
					sumAbsPhi += fabs(phi[u*m*k+v*k+r]);
			b[r] = sumAbsPhi;
		}
		//gam2 = sum(gam,1);
		for (mwSize u=0; u<k; u++)
		{
			Real sumOnColumn = 0.0;
			for (mwSize v=0; v<n; v++)
				sumOnColumn += gam[v*k+u];
			gam2[u] = sumOnColumn;
		}
		//a=sum(gam*transpose(log(pi)));
		Real a = 0.0;
		for (mwSize u=0; u<n; u++)
		{
			Real dotProduct = 0.0;
			for (mwSize v=0; v<k; v++)
				dotProduct += gam[u*k+v] * log(pi[v]);
			a += dotProduct;
		}
		
		//tant que les proportions sont negatives
		mwSize kk = 0;
		int pi2AllPositive = 0;
		Real invN = 1.0/n;
		while (!pi2AllPositive)
		{
			//pi2(:)=pi(:)+0.1^kk*(1/n*gam2(:)-pi(:));
			for (mwSize r=0; r<k; r++)
				pi2[r] = pi[r] + pow(0.1,kk) * (invN*gam2[r] - pi[r]);
			pi2AllPositive = 1;
			for (mwSize r=0; r<k; r++)
			{
				if (pi2[r] < 0)
				{
					pi2AllPositive = 0;
					break;
				}
			}
			kk++;
		}
		
		//t(m) la plus grande valeur dans la grille O.1^k tel que ce soit décroissante ou constante
		//(pi.^gamma)*b
		Real piPowGammaDotB = 0.0;
		for (mwSize v=0; v<k; v++)
			piPowGammaDotB += pow(pi[v],gamma) * b[v];
		//(pi2.^gamma)*b
		Real pi2PowGammaDotB = 0.0;
		for (mwSize v=0; v<k; v++)
			pi2PowGammaDotB += pow(pi2[v],gamma) * b[v];
		//transpose(gam2)*log(pi2)
		Real prodGam2logPi2 = 0.0;
		for (mwSize v=0; v<k; v++)
			prodGam2logPi2 += gam2[v] * log(pi2[v]);
		while (-invN*a + lambda*piPowGammaDotB < -invN*prodGam2logPi2 + lambda*pi2PowGammaDotB && kk<1000)
		{
			//pi2=pi+0.1^kk*(1/n*gam2-pi);
			for (mwSize v=0; v<k; v++)
				pi2[v] = pi[v] + pow(0.1,kk) * (invN*gam2[v] - pi[v]);
			//pi2 was updated, so we recompute pi2PowGammaDotB and prodGam2logPi2
			pi2PowGammaDotB = 0.0;
			for (mwSize v=0; v<k; v++)
				pi2PowGammaDotB += pow(pi2[v],gamma) * b[v];
			prodGam2logPi2 = 0.0;
			for (mwSize v=0; v<k; v++)
				prodGam2logPi2 += gam2[v] * log(pi2[v]);
			kk++;
		}
		Real t = pow(0.1,kk);
		//sum(pi+t*(pi2-pi))
		Real sumPiPlusTbyDiff = 0.0;
		for (mwSize v=0; v<k; v++)
			sumPiPlusTbyDiff += (pi[v] + t*(pi2[v] - pi[v]));
		//pi=(pi+t*(pi2-pi))/sum(pi+t*(pi2-pi));
		for (mwSize v=0; v<k; v++)
			pi[v] = (pi[v] + t*(pi2[v] - pi[v])) / sumPiPlusTbyDiff;
		
		//Pour phi et rho
		for (mwSize r=0; r<k; r++)
		{
			for (mwSize mm=0; mm<m; mm++)
			{
				for (mwSize i=0; i<n; i++)
				{
					//< X2(i,:,r) , phi(:,mm,r) >
					Real dotProduct = 0.0;
					for (mwSize u=0; u<p; u++)
						dotProduct += X2[i*p*k+u*k+r] * phi[u*m*k+mm*k+r];
					//ps1(i,mm,r)=Y2(i,mm,r)*dot(X2(i,:,r),phi(:,mm,r));
					ps1[i*m*k+mm*k+r] = Y2[i*m*k+mm*k+r] * dotProduct;
					nY21[i*m*k+mm*k+r] = Y2[i*m*k+mm*k+r] * Y2[i*m*k+mm*k+r];
				}
				//ps(mm,r)=sum(ps1(:,mm,r));
				Real sumPs1 = 0.0;
				for (mwSize u=0; u<n; u++)
					sumPs1 += ps1[u*m*k+mm*k+r];
				ps[mm*k+r] = sumPs1;
				//nY2(mm,r)=sum(nY21(:,mm,r));
				Real sumNy21 = 0.0;
				for (mwSize u=0; u<n; u++)
					sumNy21 += nY21[u*m*k+mm*k+r];
				nY2[mm*k+r] = sumNy21;
				//rho(mm,mm,r)=((ps(mm,r)+sqrt(ps(mm,r)^2+4*nY2(mm,r)*(gam2(r))))/(2*nY2(mm,r)));
				rho[mm*m*k+mm*k+r] = ( ps[mm*k+r] + sqrt( ps[mm*k+r]*ps[mm*k+r] 
					+ 4*nY2[mm*k+r] * (gam2[r]) ) ) / (2*nY2[mm*k+r]);
			}
		}
		for (mwSize r=0; r<k; r++)
		{
			for (mwSize j=0; j<p; j++)
			{
				for (mwSize mm=0; mm<m; mm++)
				{
					//sum(phi(1:j-1,mm,r).*transpose(Gram2(j,1:j-1,r)))+sum(phi(j+1:p,mm,r).*transpose(Gram2(j,j+1:p,r)))
					Real dotPhiGram2 = 0.0;
					for (mwSize u=0; u<j; u++)
						dotPhiGram2 += phi[u*m*k+mm*k+r] * Gram2[j*p*k+u*k+r];
					for (mwSize u=j+1; u<p; u++)
						dotPhiGram2 += phi[u*m*k+mm*k+r] * Gram2[j*p*k+u*k+r];
					//S(j,r,mm)=-rho(mm,mm,r)*ps2(j,mm,r)+sum(phi(1:j-1,mm,r).*transpose(Gram2(j,1:j-1,r)))
					//    +sum(phi(j+1:p,mm,r).*transpose(Gram2(j,j+1:p,r)));
					S[j*m*k+mm*k+r] = -rho[mm*m*k+mm*k+r] * ps2[j*m*k+mm*k+r] + dotPhiGram2;
					if (fabs(S[j*m*k+mm*k+r]) <= n*lambda*pow(pi[r],gamma))
						phi[j*m*k+mm*k+r] = 0;
					else if (S[j*m*k+mm*k+r] > n*lambda*pow(pi[r],gamma))
						phi[j*m*k+mm*k+r] = (n*lambda*pow(pi[r],gamma) - S[j*m*k+mm*k+r]) 
							/ Gram2[j*p*k+j*k+r];
					else
						phi[j*m*k+mm*k+r] = -(n*lambda*pow(pi[r],gamma) + S[j*m*k+mm*k+r]) 
							/ Gram2[j*p*k+j*k+r];
				}
			}
		}
		
		/////////////
		// Etape E //
		/////////////
		
		int signum;
		Real sumLogLLF2 = 0.0;
		for (mwSize i=0; i<n; i++)
		{
			Real sumLLF1 = 0.0;
			Real sumGamI = 0.0;
			Real minDotProduct = INFINITY;
            
			for (mwSize r=0; r<k; r++)
			{
				//Compute
				//Gam(i,r) = Pi(r) * det(Rho(:,:,r)) * exp( -1/2 * (Y(i,:)*Rho(:,:,r) - X(i,:)...
				//    *phi(:,:,r)) * transpose( Y(i,:)*Rho(:,:,r) - X(i,:)*phi(:,:,r) ) );
				//split in several sub-steps
				
				//compute Y(i,:)*rho(:,:,r)
				for (mwSize u=0; u<m; u++)
				{
					YiRhoR[u] = 0.0;
					for (mwSize v=0; v<m; v++)
						YiRhoR[u] += Y[i*m+v] * rho[v*m*k+u*k+r];
				}
				
				//compute X(i,:)*phi(:,:,r)
				for (mwSize u=0; u<m; u++)
				{
					XiPhiR[u] = 0.0;
					for (mwSize v=0; v<p; v++)
						XiPhiR[u] += X[i*p+v] * phi[v*m*k+u*k+r];
				}
				
				// compute dotProduct < Y(:,i)*rho(:,:,r)-X(i,:)*phi(:,:,r) . Y(:,i)*rho(:,:,r)-X(i,:)*phi(:,:,r) >
				dotProducts[r] = 0.0;
				for (mwSize u=0; u<m; u++)
					dotProducts[r] += (YiRhoR[u]-XiPhiR[u]) * (YiRhoR[u]-XiPhiR[u]);
				if (dotProducts[r] < minDotProduct)
					minDotProduct = dotProducts[r];
			}
			Real shift = 0.5*minDotProduct;
			for (mwSize r=0; r<k; r++)
			{
				//compute det(rho(:,:,r)) [TODO: avoid re-computations]
				for (mwSize u=0; u<m; u++)
				{
					for (mwSize v=0; v<m; v++)
						matrix->data[u*m+v] = rho[u*m*k+v*k+r];
				}
				gsl_linalg_LU_decomp(matrix, permutation, &signum);
				Real detRhoR = gsl_linalg_LU_det(matrix, signum);
				
				Gam[i*k+r] = pi[r] * detRhoR * exp(-0.5*dotProducts[r] + shift);
				sumLLF1 += Gam[i*k+r] / pow(2*M_PI,m/2.0);
				sumGamI += Gam[i*k+r];
			}
			sumLogLLF2 += log(sumLLF1);
			for (mwSize r=0; r<k; r++)
			{
				//gam(i,r)=Gam(i,r)/sum(Gam(i,:));
				gam[i*k+r] = sumGamI > EPS
					? Gam[i*k+r] / sumGamI
					: 0.0;
			}
		}
		
		//sum(pen(ite,:))
		Real sumPen = 0.0;
		for (mwSize r=0; r<k; r++)
			sumPen += pow(pi[r],gamma) * b[r];
		//LLF(ite)=-1/n*sum(log(LLF2(ite,:)))+lambda*sum(pen(ite,:));
		LLF[ite] = -invN * sumLogLLF2 + lambda * sumPen;
		if (ite == 0)
			dist = LLF[ite];
		else 
			dist = (LLF[ite] - LLF[ite-1]) / (1.0 + fabs(LLF[ite]));
		
		//Dist1=max(max((abs(phi-Phi))./(1+abs(phi))));
		Real Dist1 = 0.0;
		for (mwSize u=0; u<p; u++)
		{
			for (mwSize v=0; v<m; v++)
			{
				for (mwSize w=0; w<k; w++)
				{
					Real tmpDist = fabs(phi[u*m*k+v*k+w]-Phi[u*m*k+v*k+w]) 
						/ (1.0+fabs(phi[u*m*k+v*k+w]));
					if (tmpDist > Dist1)
						Dist1 = tmpDist;
				}
			}
		}
		//Dist2=max(max((abs(rho-Rho))./(1+abs(rho))));
		Real Dist2 = 0.0;
		for (mwSize u=0; u<m; u++)
		{
			for (mwSize v=0; v<m; v++)
			{
				for (mwSize w=0; w<k; w++)
				{
					Real tmpDist = fabs(rho[u*m*k+v*k+w]-Rho[u*m*k+v*k+w]) 
						/ (1.0+fabs(rho[u*m*k+v*k+w]));
					if (tmpDist > Dist2)
						Dist2 = tmpDist;
				}
			}
		}
		//Dist3=max(max((abs(pi-Pi))./(1+abs(Pi))));
		Real Dist3 = 0.0;
		for (mwSize u=0; u<n; u++)
		{
			for (mwSize v=0; v<k; v++)
			{
				Real tmpDist = fabs(pi[v]-Pi[v]) / (1.0+fabs(pi[v]));
				if (tmpDist > Dist3)
					Dist3 = tmpDist;
			}
		}
		//dist2=max([max(Dist1),max(Dist2),max(Dist3)]);
		dist2 = Dist1;
		if (Dist2 > dist2)
			dist2 = Dist2;
		if (Dist3 > dist2)
			dist2 = Dist3;
		
		ite++;
	}
	
	//free memory
	free(b);
	free(gam);
	free(Gam);
	free(Phi);
	free(Rho);
	free(Pi);
	free(ps);
	free(nY2);
	free(ps1);
	free(nY21);
	free(Gram2);
	free(ps2);
	gsl_matrix_free(matrix);
	gsl_permutation_free(permutation);
	free(XiPhiR);
	free(YiRhoR);
	free(gam2);
	free(pi2);
	free(X2);
	free(Y2);
	free(dotProducts);
}
Commit	Line	Data
1d3c1faa BA	1	#include "EMGLLF.h"
	2	#include <gsl/gsl_linalg.h>
	3
	4	// TODO: comment on EMGLLF purpose
	5	void EMGLLF(
	6	// IN parameters
	7	const Real* phiInit, // parametre initial de moyenne renormalisé
	8	const Real* rhoInit, // parametre initial de variance renormalisé
	9	const Real* piInit, // parametre initial des proportions
	10	const Real* gamInit, // paramètre initial des probabilités a posteriori de chaque échantillon
	11	Int mini, // nombre minimal d'itérations dans l'algorithme EM
	12	Int maxi, // nombre maximal d'itérations dans l'algorithme EM
	13	Real gamma, // valeur de gamma : puissance des proportions dans la pénalisation pour un Lasso adaptatif
	14	Real lambda, // valeur du paramètre de régularisation du Lasso
	15	const Real* X, // régresseurs
	16	const Real* Y, // réponse
	17	Real tau, // seuil pour accepter la convergence
	18	// OUT parameters (all pointers, to be modified)
	19	Real* phi, // parametre de moyenne renormalisé, calculé par l'EM
	20	Real* rho, // parametre de variance renormalisé, calculé par l'EM
	21	Real* pi, // parametre des proportions renormalisé, calculé par l'EM
	22	Real* LLF, // log vraisemblance associé à cet échantillon, pour les valeurs estimées des paramètres
	23	Real* S,
	24	// additional size parameters
	25	mwSize n, // nombre d'echantillons
	26	mwSize p, // nombre de covariables
	27	mwSize m, // taille de Y (multivarié)
	28	mwSize k) // nombre de composantes dans le mélange
	29	{
	30	//Initialize outputs
	31	copyArray(phiInit, phi, pmk);
	32	copyArray(rhoInit, rho, mmk);
	33	copyArray(piInit, pi, k);
	34	zeroArray(LLF, maxi);
	35	//S is already allocated, and doesn't need to be 'zeroed'
	36
	37	//Other local variables
	38	//NOTE: variables order is always [maxi],n,p,m,k
	39	Real* gam = (Real)malloc(nk*sizeof(Real));
	40	copyArray(gamInit, gam, n*k);
	41	Real* b = (Real)malloc(ksizeof(Real));
	42	Real* Phi = (Real)malloc(pmksizeof(Real));
	43	Real* Rho = (Real)malloc(mmksizeof(Real));
	44	Real* Pi = (Real)malloc(ksizeof(Real));
	45	Real* gam2 = (Real)malloc(ksizeof(Real));
	46	Real* pi2 = (Real)malloc(ksizeof(Real));
	47	Real* Gram2 = (Real)malloc(ppksizeof(Real));
	48	Real* ps = (Real)malloc(mk*sizeof(Real));
	49	Real* nY2 = (Real)malloc(mk*sizeof(Real));
	50	Real* ps1 = (Real)malloc(nmksizeof(Real));
	51	Real* ps2 = (Real)malloc(pmksizeof(Real));
	52	Real* nY21 = (Real)malloc(nmksizeof(Real));
	53	Real* Gam = (Real)malloc(nk*sizeof(Real));
	54	Real* X2 = (Real)malloc(npksizeof(Real));
	55	Real* Y2 = (Real)malloc(nmksizeof(Real));
	56	gsl_matrix* matrix = gsl_matrix_alloc(m, m);
	57	gsl_permutation* permutation = gsl_permutation_alloc(m);
	58	Real* YiRhoR = (Real)malloc(msizeof(Real));
	59	Real* XiPhiR = (Real)malloc(msizeof(Real));
	60	Real dist = 0.0;
	61	Real dist2 = 0.0;
	62	Int ite = 0;
	63	Real EPS = 1e-15;
	64	Real* dotProducts = (Real)malloc(ksizeof(Real));
65
66	while (ite < mini \|\| (ite < maxi && (dist >= tau \|\| dist2 >= sqrt(tau))))
67	{
68	copyArray(phi, Phi, pmk);
69	copyArray(rho, Rho, mmk);
70	copyArray(pi, Pi, k);
71
72	// Calculs associes a Y et X
73	for (mwSize r=0; r<k; r++)
74	{
75	for (mwSize mm=0; mm<m; mm++)
76	{
77	//Y2(:,mm,r)=sqrt(gam(:,r)).*transpose(Y(mm,:));
78	for (mwSize u=0; u<n; u++)
79	Y2[umk+mmk+r] = sqrt(gam[uk+r]) * Y[u*m+mm];
80	}
81	for (mwSize i=0; i<n; i++)
82	{
83	//X2(i,:,r)=X(i,:).*sqrt(gam(i,r));
84	for (mwSize u=0; u<p; u++)
85	X2[ipk+uk+r] = sqrt(gam[ik+r]) * X[i*p+u];
86	}
87	for (mwSize mm=0; mm<m; mm++)
88	{
89	//ps2(:,mm,r)=transpose(X2(:,:,r))*Y2(:,mm,r);
90	for (mwSize u=0; u<p; u++)
91	{
92	Real dotProduct = 0.0;
93	for (mwSize v=0; v<n; v++)
94	dotProduct += X2[vpk+uk+r] Y2[vmk+mm*k+r];
95	ps2[umk+mm*k+r] = dotProduct;
96	}
97	}
98	for (mwSize j=0; j<p; j++)
99	{
100	for (mwSize s=0; s<p; s++)
101	{
102	//Gram2(j,s,r)=transpose(X2(:,j,r))*(X2(:,s,r));
103	Real dotProduct = 0.0;
104	for (mwSize u=0; u<n; u++)
105	dotProduct += X2[upk+jk+r] X2[upk+s*k+r];
106	Gram2[jpk+s*k+r] = dotProduct;
107	}
108	}
109	}
110
111	/////////////
112	// Etape M //
113	/////////////
114
115	// Pour pi
116	for (mwSize r=0; r<k; r++)
117	{
118	//b(r) = sum(sum(abs(phi(:,:,r))));
119	Real sumAbsPhi = 0.0;
120	for (mwSize u=0; u<p; u++)
121	for (mwSize v=0; v<m; v++)
122	sumAbsPhi += fabs(phi[umk+v*k+r]);
123	b[r] = sumAbsPhi;
124	}
125	//gam2 = sum(gam,1);
126	for (mwSize u=0; u<k; u++)
127	{
128	Real sumOnColumn = 0.0;
129	for (mwSize v=0; v<n; v++)
130	sumOnColumn += gam[v*k+u];
131	gam2[u] = sumOnColumn;
132	}
133	//a=sum(gam*transpose(log(pi)));
134	Real a = 0.0;
135	for (mwSize u=0; u<n; u++)
136	{
137	Real dotProduct = 0.0;
138	for (mwSize v=0; v<k; v++)
139	dotProduct += gam[uk+v] log(pi[v]);
140	a += dotProduct;
141	}
142
143	//tant que les proportions sont negatives
144	mwSize kk = 0;
145	int pi2AllPositive = 0;
146	Real invN = 1.0/n;
147	while (!pi2AllPositive)
148	{
149	//pi2(:)=pi(:)+0.1^kk(1/ngam2(:)-pi(:));
150	for (mwSize r=0; r<k; r++)
151	pi2[r] = pi[r] + pow(0.1,kk) * (invN*gam2[r] - pi[r]);
152	pi2AllPositive = 1;
153	for (mwSize r=0; r<k; r++)
154	{
155	if (pi2[r] < 0)
156	{
157	pi2AllPositive = 0;
158	break;
159	}
160	}
161	kk++;
162	}
163
164	//t(m) la plus grande valeur dans la grille O.1^k tel que ce soit décroissante ou constante
165	//(pi.^gamma)*b
166	Real piPowGammaDotB = 0.0;
167	for (mwSize v=0; v<k; v++)
168	piPowGammaDotB += pow(pi[v],gamma) * b[v];
169	//(pi2.^gamma)*b
170	Real pi2PowGammaDotB = 0.0;
171	for (mwSize v=0; v<k; v++)
172	pi2PowGammaDotB += pow(pi2[v],gamma) * b[v];
173	//transpose(gam2)*log(pi2)
174	Real prodGam2logPi2 = 0.0;
175	for (mwSize v=0; v<k; v++)
176	prodGam2logPi2 += gam2[v] * log(pi2[v]);
177	while (-invNa + lambdapiPowGammaDotB < -invNprodGam2logPi2 + lambdapi2PowGammaDotB && kk<1000)
178	{
179	//pi2=pi+0.1^kk(1/ngam2-pi);
180	for (mwSize v=0; v<k; v++)
181	pi2[v] = pi[v] + pow(0.1,kk) * (invN*gam2[v] - pi[v]);
182	//pi2 was updated, so we recompute pi2PowGammaDotB and prodGam2logPi2
183	pi2PowGammaDotB = 0.0;
184	for (mwSize v=0; v<k; v++)
185	pi2PowGammaDotB += pow(pi2[v],gamma) * b[v];
186	prodGam2logPi2 = 0.0;
187	for (mwSize v=0; v<k; v++)
188	prodGam2logPi2 += gam2[v] * log(pi2[v]);
189	kk++;
190	}
191	Real t = pow(0.1,kk);
192	//sum(pi+t*(pi2-pi))
193	Real sumPiPlusTbyDiff = 0.0;
194	for (mwSize v=0; v<k; v++)
195	sumPiPlusTbyDiff += (pi[v] + t*(pi2[v] - pi[v]));
196	//pi=(pi+t(pi2-pi))/sum(pi+t(pi2-pi));
197	for (mwSize v=0; v<k; v++)
198	pi[v] = (pi[v] + t*(pi2[v] - pi[v])) / sumPiPlusTbyDiff;
199
200	//Pour phi et rho
201	for (mwSize r=0; r<k; r++)
202	{
203	for (mwSize mm=0; mm<m; mm++)
204	{
205	for (mwSize i=0; i<n; i++)
206	{
207	//< X2(i,:,r) , phi(:,mm,r) >
208	Real dotProduct = 0.0;
209	for (mwSize u=0; u<p; u++)
210	dotProduct += X2[ipk+uk+r] phi[umk+mm*k+r];
211	//ps1(i,mm,r)=Y2(i,mm,r)*dot(X2(i,:,r),phi(:,mm,r));
212	ps1[imk+mmk+r] = Y2[imk+mmk+r] * dotProduct;
213	nY21[imk+mmk+r] = Y2[imk+mmk+r] * Y2[imk+mm*k+r];
214	}
215	//ps(mm,r)=sum(ps1(:,mm,r));
216	Real sumPs1 = 0.0;
217	for (mwSize u=0; u<n; u++)
218	sumPs1 += ps1[umk+mm*k+r];
219	ps[mm*k+r] = sumPs1;
220	//nY2(mm,r)=sum(nY21(:,mm,r));
221	Real sumNy21 = 0.0;
222	for (mwSize u=0; u<n; u++)
223	sumNy21 += nY21[umk+mm*k+r];
224	nY2[mm*k+r] = sumNy21;
225	//rho(mm,mm,r)=((ps(mm,r)+sqrt(ps(mm,r)^2+4nY2(mm,r)(gam2(r))))/(2*nY2(mm,r)));
226	rho[mmmk+mmk+r] = ( ps[mmk+r] + sqrt( ps[mmk+r]ps[mm*k+r]
227	+ 4nY2[mmk+r] * (gam2[r]) ) ) / (2nY2[mmk+r]);
228	}
229	}
230	for (mwSize r=0; r<k; r++)
231	{
232	for (mwSize j=0; j<p; j++)
233	{
234	for (mwSize mm=0; mm<m; mm++)
235	{
236	//sum(phi(1:j-1,mm,r).transpose(Gram2(j,1:j-1,r)))+sum(phi(j+1:p,mm,r).transpose(Gram2(j,j+1:p,r)))
237	Real dotPhiGram2 = 0.0;
238	for (mwSize u=0; u<j; u++)
239	dotPhiGram2 += phi[umk+mmk+r] Gram2[jpk+u*k+r];
240	for (mwSize u=j+1; u<p; u++)
241	dotPhiGram2 += phi[umk+mmk+r] Gram2[jpk+u*k+r];
242	//S(j,r,mm)=-rho(mm,mm,r)ps2(j,mm,r)+sum(phi(1:j-1,mm,r).transpose(Gram2(j,1:j-1,r)))
243	// +sum(phi(j+1:p,mm,r).*transpose(Gram2(j,j+1:p,r)));
244	S[jmk+mmk+r] = -rho[mmmk+mmk+r] * ps2[jmk+mm*k+r] + dotPhiGram2;
245	if (fabs(S[jmk+mmk+r]) <= nlambda*pow(pi[r],gamma))
246	phi[jmk+mm*k+r] = 0;
247	else if (S[jmk+mmk+r] > nlambda*pow(pi[r],gamma))
248	phi[jmk+mmk+r] = (nlambdapow(pi[r],gamma) - S[jmk+mmk+r])
249	/ Gram2[jpk+j*k+r];
250	else
251	phi[jmk+mmk+r] = -(nlambdapow(pi[r],gamma) + S[jmk+mmk+r])
252	/ Gram2[jpk+j*k+r];
253	}
254	}
255	}
256
257	/////////////
258	// Etape E //
259	/////////////
260
261	int signum;
262	Real sumLogLLF2 = 0.0;
263	for (mwSize i=0; i<n; i++)
264	{
265	Real sumLLF1 = 0.0;
266	Real sumGamI = 0.0;
267	Real minDotProduct = INFINITY;
268
269	for (mwSize r=0; r<k; r++)
270	{
271	//Compute
272	//Gam(i,r) = Pi(r) * det(Rho(:,:,r)) * exp( -1/2 * (Y(i,:)*Rho(:,:,r) - X(i,:)...
273	// phi(:,:,r)) transpose( Y(i,:)Rho(:,:,r) - X(i,:)phi(:,:,r) ) );
274	//split in several sub-steps
275
276	//compute Y(i,:)*rho(:,:,r)
277	for (mwSize u=0; u<m; u++)
278	{
279	YiRhoR[u] = 0.0;
280	for (mwSize v=0; v<m; v++)
281	YiRhoR[u] += Y[im+v] rho[vmk+u*k+r];
282	}
283
284	//compute X(i,:)*phi(:,:,r)
285	for (mwSize u=0; u<m; u++)
286	{
287	XiPhiR[u] = 0.0;
288	for (mwSize v=0; v<p; v++)
289	XiPhiR[u] += X[ip+v] phi[vmk+u*k+r];
290	}
291
292	// compute dotProduct < Y(:,i)rho(:,:,r)-X(i,:)phi(:,:,r) . Y(:,i)rho(:,:,r)-X(i,:)phi(:,:,r) >
293	dotProducts[r] = 0.0;
294	for (mwSize u=0; u<m; u++)
295	dotProducts[r] += (YiRhoR[u]-XiPhiR[u]) * (YiRhoR[u]-XiPhiR[u]);
296	if (dotProducts[r] < minDotProduct)
297	minDotProduct = dotProducts[r];
298	}
299	Real shift = 0.5*minDotProduct;
300	for (mwSize r=0; r<k; r++)
301	{
302	//compute det(rho(:,:,r)) [TODO: avoid re-computations]
303	for (mwSize u=0; u<m; u++)
304	{
305	for (mwSize v=0; v<m; v++)
306	matrix->data[um+v] = rho[umk+vk+r];
307	}
308	gsl_linalg_LU_decomp(matrix, permutation, &signum);
309	Real detRhoR = gsl_linalg_LU_det(matrix, signum);
310
311	Gam[ik+r] = pi[r] detRhoR * exp(-0.5*dotProducts[r] + shift);
312	sumLLF1 += Gam[ik+r] / pow(2M_PI,m/2.0);
313	sumGamI += Gam[i*k+r];
314	}
315	sumLogLLF2 += log(sumLLF1);
316	for (mwSize r=0; r<k; r++)
317	{
318	//gam(i,r)=Gam(i,r)/sum(Gam(i,:));
319	gam[i*k+r] = sumGamI > EPS
320	? Gam[i*k+r] / sumGamI
321	: 0.0;
322	}
323	}
324
325	//sum(pen(ite,:))
326	Real sumPen = 0.0;
327	for (mwSize r=0; r<k; r++)
328	sumPen += pow(pi[r],gamma) * b[r];
329	//LLF(ite)=-1/nsum(log(LLF2(ite,:)))+lambdasum(pen(ite,:));
330	LLF[ite] = -invN * sumLogLLF2 + lambda * sumPen;
331	if (ite == 0)
332	dist = LLF[ite];
333	else
334	dist = (LLF[ite] - LLF[ite-1]) / (1.0 + fabs(LLF[ite]));
335
336	//Dist1=max(max((abs(phi-Phi))./(1+abs(phi))));
337	Real Dist1 = 0.0;
338	for (mwSize u=0; u<p; u++)
339	{
340	for (mwSize v=0; v<m; v++)
341	{
342	for (mwSize w=0; w<k; w++)
343	{
344	Real tmpDist = fabs(phi[umk+vk+w]-Phi[umk+vk+w])
345	/ (1.0+fabs(phi[umk+v*k+w]));
346	if (tmpDist > Dist1)
347	Dist1 = tmpDist;
348	}
349	}
350	}
351	//Dist2=max(max((abs(rho-Rho))./(1+abs(rho))));
352	Real Dist2 = 0.0;
353	for (mwSize u=0; u<m; u++)
354	{
355	for (mwSize v=0; v<m; v++)
356	{
357	for (mwSize w=0; w<k; w++)
358	{
359	Real tmpDist = fabs(rho[umk+vk+w]-Rho[umk+vk+w])
360	/ (1.0+fabs(rho[umk+v*k+w]));
361	if (tmpDist > Dist2)
362	Dist2 = tmpDist;
363	}
364	}
365	}
366	//Dist3=max(max((abs(pi-Pi))./(1+abs(Pi))));
367	Real Dist3 = 0.0;
368	for (mwSize u=0; u<n; u++)
369	{
370	for (mwSize v=0; v<k; v++)
371	{
372	Real tmpDist = fabs(pi[v]-Pi[v]) / (1.0+fabs(pi[v]));
373	if (tmpDist > Dist3)
374	Dist3 = tmpDist;
375	}
376	}
377	//dist2=max([max(Dist1),max(Dist2),max(Dist3)]);
378	dist2 = Dist1;
379	if (Dist2 > dist2)
380	dist2 = Dist2;
381	if (Dist3 > dist2)
382	dist2 = Dist3;
383
384	ite++;
385	}
386
387	//free memory
388	free(b);
389	free(gam);
390	free(Gam);
391	free(Phi);
392	free(Rho);
393	free(Pi);
394	free(ps);
395	free(nY2);
396	free(ps1);
397	free(nY21);
398	free(Gram2);
399	free(ps2);
400	gsl_matrix_free(matrix);
401	gsl_permutation_free(permutation);
402	free(XiPhiR);
403	free(YiRhoR);
404	free(gam2);
405	free(pi2);
406	free(X2);
407	free(Y2);
408	free(dotProducts);
409	}