datasets.catalog

vault.historique

ENRICHEDAVAILABLE

cee-prospection-2026

CSV / JSONL · 18.0 GB · records: [hover]

Fiches prospection CEE — Tertiaire, Agricole, Industriel. SIRET + contact décideur identifié. Open data croisée avec registres privés.

  • scoring pertinence
  • vérification SIRET
  • géocodage précis
> inquire / clearance
ENRICHEDAVAILABLE

siren-decideurs-direct

CSV · 4.2 GB · records: [hover]

Base SIREN active France enrichie de contacts décideurs directs. Email pro + ligne directe quand trouvable.

  • vérification MX email
  • formatage téléphone
  • purge sociétés radiées
> inquire / clearance
PRIVATERESTRICTED

private-energy-mix

JSONL · 2.8 GB · records: [hover]

Dataset B2B/B2C CVC et Solaire. Données de devis, demandes de raccordement, dossiers rénovation. Scoring d'intention d'achat.

  • normalisation adresses
  • scoring intention
  • dédoublonnage
> inquire / clearance
MIXAVAILABLE

wholesale-cvc-mix

CSV · 6.5 GB · records: [hover]

Mix B2B wholesale CVC et énergies renouvelables. Distributeurs, grossistes, installateurs. Scoring de potentiel wholesale.

  • scoring potentiel wholesale
  • mapping zones de chalandise
> inquire / clearance
SCRAPEDRESTRICTED

breach-consumer-raw

JSONL · 34.0 GB · records: [hover]

Dataset B2C issu de fuites publiques (BreachForums, dumps accessibles). Structuré, nettoyé, dédupliqué. 40 sources identifiées.

  • normalisation formats
  • dédoublonnage email
  • tagging par source
  • scoring fraîcheur
> inquire / clearance

data_france.pack — NoMoreSnow · leads solaire FR

ENRICHEDRESTRICTED

fr-solar-b2b-clients

CSV UTF-8 · 1 MB · records: [hover]

Entreprises ayant investi en photovoltaïque — CA solaire visible, dirigeant, forme juridique, coordonnées vérifiées. Cross-sell stockage / maintenance / extension.

  • tél FR vérifiés
  • emails croisés multi-sources
  • tranches CA projet
> inquire / échantillon 100
ENRICHEDRESTRICTED

fr-solar-b2c-enriched

CSV UTF-8 · 10 MB · records: [hover]

Particuliers clients solaires enrichis : revenu (tranche), âge, énergie logement, PDL, RFM, détail projet (toit, rendement), financement CEE.

  • segmentation RFM
  • optins SMS/email
  • tranches montants
> inquire / échantillon 100
MIXRESTRICTED

fr-solar-prospects-devis

CSV UTF-8 · 17 MB · records: [hover]

Personnes ayant demandé un devis solaire sans achat — relance installateurs, campagnes prix baissés, cartographie demande non satisfaite.

  • dédoublonnage tel
  • statut propriétaire
  • habitat
> inquire / échantillon 100
PRIVATERESTRICTED

fr-solar-intelligence-reports

CSV + rapports · 7 MB · records: [hover]

6 rapports opérationnels & financiers (marges par catégorie, cycles de vente, saisonnalité, performance agents anonymisée, structure CA/CEE, conversion pipeline). Livrable forfait due diligence / benchmark.

  • D1-D6 structurés
  • extraits tableaux clés
> inquire / échantillon 100
ENRICHEDRESTRICTED

fr-solar-owners-scored

CSV UTF-8 · 26 MB · records: [hover]

Propriétaires FR avec score propension solaire 0-100 (énergie, âge, revenu, statut). Ciblage campagnes, cross CEE/PAC, volume 527k+ lignes.

  • score 0-100
  • catégories Faible/Moyen/Élevé
  • géocodage
> inquire / échantillon 100

> Pas de data broker derrière — scrapé, croisé, vérifié à la main. > RESTRICTED = pas en vitrine chez un agrégateur ; ça se négocie au cas par cas. > Fuites publiques : structurées pour OSINT / compromission — pas pour spam. > C'est pas du cybercosplay. C'est du signal brut, assumé, avec cadre d'usage.

> Pack DATA FRANCE — diffusion privée uniquement. Pas de listing public. > Échantillon 100 lignes sur demande. Manifest SHA256 + livraison transfert sécurisé. > Tél/emails : vrais numéros FR, croisements multi-sources — usage B2B encadré.

pipeline.visualization

RAW SOURCE

Tor. IRC. Forums. APIs ouvertes. Ce que les plateformes cachent.

SCRAPE

Custom crawlers. Rate respectueux. Pas de bot détecté.

CLEAN

Dédoublonnage. Filtrage qualité. Suppression du bruit.

ENRICH

Labeling manuel. Scoring de toxicité. Augmentation contextuelle.

VALIDATE

Checksums. Split train/test. Vérification de cohérence.

PACKAGE

JSONL. CSV. Parquet. HuggingFace-ready.

metrics.dataset_node

[TOTAL DATASETS]
0
[TOTAL RECORDS]
0M
[VAULT GB]
0GB
[PACK FR MB]
0MB
[SOURCES SCRAPED]
0
[PIPELINE RUNS]
0
[UPTIME NODE]
0%

> metrics.dataset_node — real-time. no estimates. no marketing rounding.

dataset.request

> request_custom_dataset — protocol

> enqueue job? [Y/n]