datasets.catalog
vault.historique
cee-prospection-2026
CSV / JSONL · 18.0 GB · records: [hover]
Fiches prospection CEE — Tertiaire, Agricole, Industriel. SIRET + contact décideur identifié. Open data croisée avec registres privés.
- scoring pertinence
- vérification SIRET
- géocodage précis
siren-decideurs-direct
CSV · 4.2 GB · records: [hover]
Base SIREN active France enrichie de contacts décideurs directs. Email pro + ligne directe quand trouvable.
- vérification MX email
- formatage téléphone
- purge sociétés radiées
private-energy-mix
JSONL · 2.8 GB · records: [hover]
Dataset B2B/B2C CVC et Solaire. Données de devis, demandes de raccordement, dossiers rénovation. Scoring d'intention d'achat.
- normalisation adresses
- scoring intention
- dédoublonnage
wholesale-cvc-mix
CSV · 6.5 GB · records: [hover]
Mix B2B wholesale CVC et énergies renouvelables. Distributeurs, grossistes, installateurs. Scoring de potentiel wholesale.
- scoring potentiel wholesale
- mapping zones de chalandise
breach-consumer-raw
JSONL · 34.0 GB · records: [hover]
Dataset B2C issu de fuites publiques (BreachForums, dumps accessibles). Structuré, nettoyé, dédupliqué. 40 sources identifiées.
- normalisation formats
- dédoublonnage email
- tagging par source
- scoring fraîcheur
data_france.pack — NoMoreSnow · leads solaire FR
fr-solar-b2b-clients
CSV UTF-8 · 1 MB · records: [hover]
Entreprises ayant investi en photovoltaïque — CA solaire visible, dirigeant, forme juridique, coordonnées vérifiées. Cross-sell stockage / maintenance / extension.
- tél FR vérifiés
- emails croisés multi-sources
- tranches CA projet
fr-solar-b2c-enriched
CSV UTF-8 · 10 MB · records: [hover]
Particuliers clients solaires enrichis : revenu (tranche), âge, énergie logement, PDL, RFM, détail projet (toit, rendement), financement CEE.
- segmentation RFM
- optins SMS/email
- tranches montants
fr-solar-prospects-devis
CSV UTF-8 · 17 MB · records: [hover]
Personnes ayant demandé un devis solaire sans achat — relance installateurs, campagnes prix baissés, cartographie demande non satisfaite.
- dédoublonnage tel
- statut propriétaire
- habitat
fr-solar-intelligence-reports
CSV + rapports · 7 MB · records: [hover]
6 rapports opérationnels & financiers (marges par catégorie, cycles de vente, saisonnalité, performance agents anonymisée, structure CA/CEE, conversion pipeline). Livrable forfait due diligence / benchmark.
- D1-D6 structurés
- extraits tableaux clés
fr-solar-owners-scored
CSV UTF-8 · 26 MB · records: [hover]
Propriétaires FR avec score propension solaire 0-100 (énergie, âge, revenu, statut). Ciblage campagnes, cross CEE/PAC, volume 527k+ lignes.
- score 0-100
- catégories Faible/Moyen/Élevé
- géocodage
> Pas de data broker derrière — scrapé, croisé, vérifié à la main. > RESTRICTED = pas en vitrine chez un agrégateur ; ça se négocie au cas par cas. > Fuites publiques : structurées pour OSINT / compromission — pas pour spam. > C'est pas du cybercosplay. C'est du signal brut, assumé, avec cadre d'usage.
> Pack DATA FRANCE — diffusion privée uniquement. Pas de listing public. > Échantillon 100 lignes sur demande. Manifest SHA256 + livraison transfert sécurisé. > Tél/emails : vrais numéros FR, croisements multi-sources — usage B2B encadré.
pipeline.visualization
Tor. IRC. Forums. APIs ouvertes. Ce que les plateformes cachent.
Custom crawlers. Rate respectueux. Pas de bot détecté.
Dédoublonnage. Filtrage qualité. Suppression du bruit.
Labeling manuel. Scoring de toxicité. Augmentation contextuelle.
Checksums. Split train/test. Vérification de cohérence.
JSONL. CSV. Parquet. HuggingFace-ready.
metrics.dataset_node
> metrics.dataset_node — real-time. no estimates. no marketing rounding.