throw away old code, prepare tests
[epclust.git] / old_C_code / stage2_UNFINISHED / src / unused / 03_compute-sums-of-classes_2010-par.r
diff --git a/old_C_code/stage2_UNFINISHED/src/unused/03_compute-sums-of-classes_2010-par.r b/old_C_code/stage2_UNFINISHED/src/unused/03_compute-sums-of-classes_2010-par.r
deleted file mode 100644 (file)
index 1a4c9a1..0000000
+++ /dev/null
@@ -1,79 +0,0 @@
-## File : 03_compute-sum-of-classes_2010-par.r
-## Description : Calculer les synchrones pour chaque groupe obtenu par le
-##               clustering. 
-
-rm(list = ls())
-
-MOJARRITA <- Sys.info()[4] ==  "mojarrita"
-
-if(MOJARRITA){ 
-  setwd("~/Documents/projects/2014_EDF-Orsay-Lyon2/codes/")
-} else {
-  setwd("~/2014_EDF-Orsay-Lyon2/codes/")
-}
-
-
-
-## 1. Read auxiliar data files ####
-
-identifiants <- read.table("identifs.txt")[ ,1]
-dates0       <- read.table("datesall.txt")[, 1]
-dates        <- dates0[grep("2010", dates0)]
-rm(dates0)
-
-n <- length(identifiants)
-p <- length(dates)
-
-
-if(MOJARRITA) { 
-  blocks <- c(rep(6500, 3), 5511) 
-} else {
-  blocks <- 25011  
-} 
-
-# Fit of the clustering : clfit 
-load('../res/clfitdf200.Rdata') # Loads res that containts  
-# clusterings memberships
-res <- as.data.frame(res)
-
-
-lres <- length(res)
-K       <- 200 #nrow(clfit$clusinfo)
-
-## 2. Process the large file ####
-
-close(con)
-con <- file("~/tmp/2010_full.txt")  # Establish a connection to the file
-open(con, "r")                      # Open the connection
-
-for(b in seq_along(blocks)){        # Reading loop
-  nb <- blocks[b]
-  actual <- readLines(con = con, n = nb )
-  auxmat <- matrix(unlist(strsplit(actual, " ")), ncol = p + 1, byrow = TRUE)
-  rm(actual)
-  
-  datamat <- t(apply(auxmat[, -1], 1, as.numeric)) # the NA introduced by as.numeric
-  # are NA strings
-  rownames(datamat) <- substr(auxmat[, 1], 2, 7)
-  rm(auxmat)
-    
-  synchros <- lapply(res, 
-                     function(ll) { 
-                       aux <- matrix(0, ncol = p, nrow = K)
-                       for(k in 1:K) {
-                         clustk <- which(ll == k)
-                         if(length(clustk) > 1) {
-                           aux[k, ] <- colSums(datamat[ll ==  k, ])
-                         } else {
-                           aux[k, ] <- datamat[ll ==  k, ]
-                         }
-                       }
-                       aux
-                     })
-}
-  
-  close(con)                # close connection to the file
-  
-# save(synchros, file = "~/tmp/2010synchrosdf200WER")
-
-